Shared posts

02 May 14:16

2018-120068 - Data scientist, spécialiste traitement du langage naturel et reconnaissance d'entités nommées (F/H)

Domaine fonctionnel : Systèmes et réseaux d'information et de communication
Nature du poste recherché : Titulaire ou contractuel
Description du poste :
Placé.e au sein de l'équipe data sciences de la mission Etalab, le ou la candidat.e sera chargé.e de développer et mettre en œuvre des méthodes de traitement du langage naturel (NLP). A titre d'exemple, il.elle pourra être amené.e à travailler sur le développement de méthodes de pseudonymisation des décisions de jurisprudence, afin notamment de pouvoir les diffuser en open data conformément à la Loi pour une République numérique. De façon générale, il.elle sera amené.e à travailler sur les questions d'occultations d'informations couvertes par des secrets. Il.elle pourra également travailler sur l'extraction d'informations structurées à partir d'éléments textuels ex. décisions de justice. L'objectif est de renforcer la compétence de la mission Etalab sur le sujet et de développer des outils libres et documentés pouvant être utilisés par les différentes administrations pour une large diffusion de données en open data.

Le ou la candidat.e doit être titulaire d'un doctorat ou d'un diplôme de niveau master en statistiques ou en data sciences ou avoir une expérience spécifique dans ce domaine. Il.elle doit avoir de solides connaissances en machine learning et une expérience en traitement du langage naturel (NLP) et reconnaissance d'entités nommées (NER). Il ou elle doit avoir une bonne connaissance en programmation (Python ou R). • Capacité à travailler en équipe et de manière agile ; • Compétences en programmation (Python et/ou R) et connaissance des bibliothèques spécialisées dans le traitement du langage naturel (Spacy, NLTK, NeuroNER, etc) ; • Compétences en traitement du langage naturel et machine learning.
Lieu d'affectation : 75007 Paris, France
19 Feb 16:14

Frequency

Frequency Frequency Frequency Frequency Frequency
Frequency Frequency Frequency Frequency Frequency
Frequency Frequency Frequency Frequency Frequency
Frequency Frequency Frequency Frequency Frequency
Frequency Frequency Frequency Frequency Frequency
Frequency Frequency Frequency Frequency Frequency
Frequency Frequency Frequency Frequency Frequency
Frequency Frequency Frequency Frequency Frequency
Frequency Frequency Frequency Frequency Frequency
Frequency Frequency Frequency Frequency Frequency
07 Feb 18:58

(ASK MEDIA POUR PARIS MATCH) Accueillir les JO permet-il de gagner plus de médailles ?

by AskMedia
Alors que les Jeux olympiques d’hiver s’ouvrent en Russie, nous avons relevé les performances des pays hôtes pendant les 21 olympiades de l’Histoire. Concourir devant son public permet-il de collecter... Read The Rest →
04 Feb 09:09

(ASK MEDIA POUR PARIS MATCH) LES CAMPAGNES : SONT-ELLES SI DÉSERTES ?

by Stéphane Saulnier
Après des décennies d’exode rural et d’urbanisation galopante, les Français font le chemin inverse depuis les années 70 et repeuplent les villages. DataMatch vous dévoile la vitalité de nos démographique... Read The Rest →
28 Jan 10:16

(HABEMUS DATAM) Chômage : le match Sarkozy / Hollande

by Marie Coussin
Ask Media inaugure une nouvelle rubrique intitulée « Habemus Datam » (« Nous avons donné »), dans laquelle nous révélerons des chiffres étonnants ou inédits sur un sujet d’actualité.  
24 Jan 15:24

The timeline of statistics

20 Jan 10:25

Vous souhaitez avoir des informations sur la police municipale de votre commune ? Venez les découvrir sur data.gouv.fr

3528251454_ceb7e6a626_o.jpg

 

Le ministère de l'intérieur recense avec le concours des préfectures, les effectifs des agents de police municipale par département et par commune ou intercommunalité. Ce recensement a lieu au cours de chaque année civile.

 

Ce fichier présente le nombre de policiers municipaux, le nombre d'agents de surveillance de la voie publique, le nombre de gardes-champêtres ainsi que le nombre de centres de supervision urbaine (CSU) pour l'ensemble des communes de France.

 

Venez découvrir ce fichier sur data.gouv.fr et n'hésitez pas à publier des réutilisations innovantes.

19 Jan 11:39

Le pacte de responsabilité des contreparties pour la simplification stratégique

by alexandre

Comment imaginer que quelques points de moins de cotisations patronales pourraient d'un seul coup améliorer nos échanges extérieurs?

François Hollande, 30-01-2012.

Le pacte de responsabilité est-il un tournant libéral?

Non. C'est une étrange perversion du langage en France que de qualifier de "politique sociale" le fait de verser des subventions pour les salariés et de "politique libérale" des subventions pour les entreprises. Dans les deux cas, il s'agit de redistribution étatique visant à orienter le fonctionnement de l'économie, ce qui n'a rien de "libéral". Une politique libérale en France signifierait un ensemble de réformes structurelles visant à accroître la concurrence sur les marchés, réduire les rentes des professions réglementées, etc. Quoi que l'on pense de l'efficacité potentielle (et de la faisabilité) de ce genre de politique, on en est bien loin avec le propos présidentiel. Le mot de concurrence n'y apparaît qu'une seule fois, assorti de l'adjectif "insupportable". Le tournant libéral, ce n'est pas franchement pour aujourd'hui. Au contraire, les dirigeants de grandes entreprises françaises savent désormais qu'il vaut mieux, pour augmenter leurs marges dans un contexte de chômage élevé, quémander des allègements fiscaux en faisant des promesses vagues sur l'emploi, plutôt que prendre des risques économiques.

Par ailleurs, il n'y a aucun changement, mais la continuité de politiques déjà mises en oeuvre. Baisser les charges, c'est l'idée du "choc de compétitivité" et du rapport Gallois, qui avaient abouti à la création dans l'improvisation du crédit d'impôt compétitivité-emploi : réduire les cotisations sociales pour favoriser l'investissement des entreprises et l'emploi. Ce genre de bonneteau fiscal est une constante des politiques françaises, de droite comme de gauche depuis des décennies.

Autre continuité : le langage boursouflé, triomphe du marketing politique sur la substance. "Pacte de responsabilité", "conseil stratégique de la dépense", des termes ronflants (il ne manque que "Grenelle" ou "plan Marshall" à la liste des clichés) pour camoufler des banalités, qui conduisent à discuter beaucoup plus du vocabulaire (libéral? Social-libéral? Social-démocrate?...) que du fond. En France, cela fonctionne à tous les coups.

30 milliards d'allègements de cotisations sociales, qui va payer?

C'est flou. Rien n'a été précisé, sinon le fait que le CICE "va s'inscrire dans le processus" ce qui laisse la possibilité de le fusionner avec cette mesure, ce qui signifierait simplement 10 milliards d'euros supplémentaires à trouver; or si les entreprises répercutent globalement cela dans leurs bénéfices, l'état récupérera environ ce solde par le biais de l'impôt sur les sociétés. Si une partie sert à l'autofinancement d'investissements, cela soutiendra l'activité. L'impact sur les finances publiques est en tout cas réduit.

Il n'est cependant pas nul, et dans ce cas, la logique voudrait qu'il soit financé par l'endettement public. Après tout, si effectivement on attend de ces allègements de cotisations sociales des effets sur l'emploi et l'activité économique, alors que les taux d'intérêt payés par le gouvernement sont ridiculement bas, on est typiquement face à une situation d'investissement public. Refuser de le financer par l'endettement serait inquiétant sur les perspectives réellement attendues de ces mesures.

Mais il est plus probable que l'on s'achemine soit vers une réduction en parallèle des dépenses de la branche famille de la sécurité sociale. En réduisant les allocations touchées par les familles nombreuses aisées, ce qui permettrait de faire passer la chose comme une mesure "de gauche". Sauf que tout ce qui réduit l'universalité des prestations sociales en réduit la légitimité. Politiquement, la politique familiale serait condamnée à brève échéance si elle apparaissait comme réservée aux familles nombreuses pauvres.

Ça peut marcher?

Les économistes considèrent en général que les allègements de cotisations sociales comme une mesure certes coûteuse, mais en général efficace pour la création d'emplois; les désaccords portent sur l'ampleur de cet effet. Certains le considèrent comme élevé, d'autres moins. C'est pour cette raison que ces allègements sont vilipendés dans l'opposition pour leur coût élevé, mais qu'on finit toujours pas y revenir une fois au pouvoir. Et que les entreprises peuvent s'attendre à ce que les allègements restent; la crainte de voir le chômage exploser si elles sont supprimées est un puissant dissuasif.Dans le contexte actuel, c'est une mesure dont on peut attendre des effets positifs.

Mais il ne faut pas se leurrer. L'économie française fait face à des vents contraires très forts. Le chômage est très élevé dans toute l'Europe, selon les prévisions de la Commission Européenne la stagnation va se poursuivre durablement, le contexte macroéconomique est très inquiétant, et à plus long terme, le retour d'une croissance durable est douteux. Bref, cela sera bien loin d'être suffisant, si tant est que cela fonctionne.

Cela dit, politiquement, les anticipations des électeurs vis à vis du gouvernement sont tellement basses que la moindre évolution moins médiocre sera très vite perçue comme très positive. Ce sont les résultats économiques 6 mois avant les élections qui comptent, pas la popularité trois ans avant.

16 Jan 16:13

Jean-François Copé : ” Il faut fusionner les régions et les départements “

by AskMedia

Retrouvez vendredi en kiosque notre interview de Jean-François Copé.

The post Jean-François Copé : ” Il faut fusionner les régions et les départements “ appeared first on Le Parisien Magazine.

16 Jan 15:24

30 milliards d'euros de baisses de cotisations : ce que l'on pourrait faire à la place

by Observatoire des inégalités

Le Président de la République a annoncé, lors de ses voeux à la presse du 14 janvier, que le gouvernement allait réduire de 30 milliards d'ici 2017 les cotisations familiales versées par les entreprises et donc alléger leurs charges. Cette somme colossale ne veut rien dire pour la majorité de la population. Nous vous proposons un chiffrage très simple de ce qui aurait pu être fait en matière de services publics, si l'exécutif en avait décidé autrement. Et si, par exemple, il avait augmenté les dépenses au lieu de réduire les recettes, ce qui revient au même [1].

Avec 30 milliards d'euros, on aurait pu augmenter de...
Le budget de la mission
Budget 2014 en milliards d'euros
1,6 fois Enseignement primaire et secondaire 46,3
2 fois Défense 29,6
2,2 fois Recherche et enseignement supérieur 25,8
3,2 fois Solidarité, insertion et égalité des chances 13,6
3,5 fois Police 12,2
3,8 fois Travail et emploi 10,8
4,8 fois Egalité des territoires, logement et ville 7,8
5,2 fois Ecologie, développement et aménagement 7,2
5,8 fois Justice 6,3
11,2 fois Anciens combattants 3
11,2 fois Agriculture 2,9
11,3 fois Aide publique au développement 2,9
11,7 fois Affaires étrangères 2,8
13,6 fois Culture 2,4
15,9 fois Outre-mer 2
24 fois Santé 1,3
37,6 fois Médias, livres et industries culturelles 0,8
46,5 fois Immigration, asile et intégration 0,7
66,2 fois Sport, jeunesse et vie associative 0,5
Principaux budgets.
Source : calculs Observatoire des inégaltiés, d'après ministère de l'Economie

Bien entendu, ce calcul totalement théorique n'a aucun sens pratique. Multiplier par deux le budget de la Défense ou par six celui de la Justice n'aurait aucun intérêt. Dépenser pour dépenser est absurde, il reste nécessaire d'économiser l'argent public. Ce chiffrage permet simplement de comprendre les ordres de grandeur. A chacun de faire son choix. On peut imaginer l'impact économique, social et au final politique d'une hausse de 20 % du budget de la recherche et de 50 % des forces de sécurité et des moyens au service de l'environnement. On aurait pu aussi utiliser ces 30 milliards pour réduire le déficit public (ce qui en représenterait 40 %), et permettrait de réduire la masse des intérêts versés par l'État.

On peut considérer les choses de façon encore plus opérationnelle. Voici le coût de quelques mesures qui auraient pu être prises pour une addition totale d'environ 30 milliards :

  • Embaucher 100 000 enseignants pour réduire le nombre d'élèves par classe et moderniser l'école = 4,5 milliards d'euros.
  • Verser un minimum social aux 1,1 million de 18-24 ans en situation de pauvreté = 6 milliards.
  • Créer 250 000 emplois jeunes : 4 milliards.
  • Construire 70 000 logements sociaux en Ile-de-France : 12,6 milliards.
  • Verser une allocation mensuelle de 70 euros à toutes les familles ayant un enfant : 3 milliards.

Chacune de ces mesures est discutable. On peut y préférer des places en crèche, un meilleur remboursement des prothèses dentaires ou des lunettes, la rénovation des prisons, les transports en commun ou encore l'amélioration de l'accueil des personnes âgées démunies, etc. La liste est longue des domaines qui font l'objet d'un relatif consensus dans notre société sur la nécessité d'agir. A chacun de choisir en fonction de la valeur qu'il accorde à ces besoins.

Il faut mesurer l'impact social qu'un tel programme de modernisation de l'action publique aurait, en répondant à des besoins sociaux majeurs. De son côté, le plan proposé par le gouvernement est censé créer des emplois et donc réduire le chômage. L'impact de la baisse des charges déjà décidée par le gouvernement - le Crédit d'impôt pour la compétitivité et l'emploi (CICE) [2], d'un coût de 20 milliards - a été évalué par l'OFCE à 150 000 emplois qui pourraient être créés d'ici 2018 soit une baisse du taux de chômage de 0,6 point. Soit pas moins de 130 000 euros dépensés par poste de travail créé.

Quel impact a une baisse de prélèvements ou une hausse des dépenses publiques ?
Les évaluations reposent en fait sur des hypothèses très fragiles sur le comportement des acteurs économiques et la croissance mondiale... Aucun emploi ne sera créé si les carnets de commandes des entreprises restent vides, quel que soit le coût du travail... Une grande partie de l'équation tient dans le mode de financement.

En situation de fort déficit et de croissance lente, il n'y a que deux solutions pour dépenser plus ou baisser les cotisations : augmenter d'autres impôts ou réduire d'autres dépenses [3]. Le crédit d'impôt actuel (le CICE) est financé essentiellement par les consommateurs par le biais de la TVA, et donc pèse sur le revenu de tous les ménages, y compris sur celui des plus démunis. C'est la façon la plus inégalitaire de procéder et aussi celle qui va avoir l'impact le plus négatif sur la consommation. On aurait pu imaginer jouer sur l'impôt proportionnel (la CSG) qui porte sur l'ensemble du revenu, ou l'impôt progressif sur le revenu, dont le taux augmente avec les ressources.

L'impact d'une baisse des dépenses dépend aussi du type de dépense réduite. S'il s'agit de prestations sociales, qui bénéficient en grande partie aux plus modestes (beaucoup sont versées sous conditions de ressources), l'impact économique est fortement négatif. S'il s'agit de diminuer les investissements publics : cela signifie moins de commandes pour les entreprises et cela a un impact à long terme sur les structures économiques. Il faut noter que le montant total (en incluant l'État et les collectivités locales) de l'investissement public est de 60 milliards d'euros. Enfin, réduire de façon drastique le nombre de fonctionnaires aurait une conséquence directe sur le nombre d'emplois global, un impact sur la croissance (les salaires des ces derniers alimentent l'activité) mais aussi sur les services rendus (moins de sécurité dans les rues, plus d'élèves par classe, etc.) ce qui a aussi un impact économique au final.

Photo / © Gina Sanders - Fotolia.com


[1] Pas tout à fait en réalité, car l'effet économique n'est pas similaire. Une hausse de dépenses relance davantage l'activité qu'une baisse de recettes.

[2] En fait, la nouvelle mesure sera un ajout de 10 milliards au CICE.

[3] Même s'il n'est pas besoin de financer l'ensemble la baisse des recettes ou de la hausse des dépenses, car l'une comme l'autre a un effet de relance de l'activité économique, et donc va augmenter à terme les recettes fiscales. Les économistes appellent cela un effet « multiplicateur », plus élevé pour une augmentation de dépense publique qu'une baisse d'impôt (en partie épargnée).

06 Jan 14:09

(VU SUR LE WEB) Les migrations intra-Berlin selon les données de l’annuaire téléphonique

by Marie Coussin
Deux universitaires, chercheurs en urbanistes, Patrick Stotz et Achim Tack , se sont intéressés (sur leur temps libre, précisent-ils) aux migrations entre les quartiers de Berlin. Si l’angle n’est pas... Read The Rest →
06 Jan 10:11

Announcing: SciCast

by Robin Hanson

A year ago I announced that our IARPA-funded DAGGRE prediction market on world events had finally implemented my combinatorial prediction market tech (which I was prevented from showcasing nine years earlier), with a new-improved tech for efficient exact computation in near-tree-shaped networks.

Now we announce: DAGGRE is dead, and SciCast is born. Still funded by IARPA, SciCast focuses on predicting science and technology, it has a cleaner interface developed by Inkling, and it has been reimplemented from scratch to support ten times as many users and questions. We also now have Bruce D’Ambrosio’s firm Tuuyi on board to develop and implement even more sophisticated algorithms.

But wait, there’s more. We’ve got formal partnerships with AAAS and IEEE, have a thousand folks pre-registered to participate, and we hope to attract thousands of expert users, folks who really know their sci/tech. We’ve seeded SciCast with over a hundred questions, many contributed by top experts, and hope to soon have thousands of questions, mostly submitted by users.

Alas, we aren’t allowed to pay our participants money or prizes. But if you have sci/tech issues you want forecasted, if you want to prove your insight into the future of sci/tech, or if you want to influence the perceived consensus on sci/tech, join us at SciCast.org!

06 Jan 09:20

Hery Rajaonarimampianina and the global leaders with the longest names

by Mona Chalabi
Pachevalier

Drôle et numérique

The new president of Madagascar, Hery Rajaonarimampianina, has made it into the record books as the head of state with the longest family name. But how do other countries' leaders fare?


01 Jan 11:02

Mozilla Popcorn Maker

by Tarek Amr

As a journalist or blogger, you usually make use of lots of online videos and audio recordings on YouTube, Vimeo or Soundcloud. However, you may need sometimes to embed your own annotations, graphs or maps on top of those videos. Popcorn Maker allows you to add those content into the videos and control where and when they should appear there.

The Time magazine published a video containing 5 inventions that they consider the top 5 inventions of 2013. Let’s take that video as an example here and see how we can embed annotations and other multimedia content in it.

You first need to go to https://popcorn.webmaker.org/, and sign in there. The signup process is easy and you normally do not need to create a password or anything.

After clicking on the sign in button, you will be asked to enter your email address. If you are using an email from one of their Identity Providers, such as Gmail or Yahoo Mail, then you will be taken to your email provider’s login page to login to your email account then you will be redirected back after being authenticated. In case you are using an email provider that is not known to them – e.g. myname@mycompany.com – then you will need to create a new password on Mozilla persona.

After logging in, you need to add the url of the YouTube video to the Popcorn maker. Links are added in the “Create new media clip” media section. You can add more than one video or audio links. If you have worked with other video editing tools, such as Windows Movie Maker for example, you will notice many similarities in the process of adding multiple media files and arranging them to work in the order you want. You also can cut and paste parts of the videos you add and reorder them, or use the audio of a SoundCloud file and make it the soundtrack of your YouTube or Vimeo video.

Now after we add the URL of the Time magazine’s video, and clicking on the “Create clip” button, the video will appear in the “My media gallery” section. The media gallery is a sort of repository where you can have all your media files. To start working with the media files you have, you need to drag them into the layers section at the bottom left side of the Popcorn Maker page.

You can think of Popcorn layers as those layers you see in Photoshop, GIMP or in Windows Movie Maker. The horizontal line shows the timeline for which item(s) are to be played at each point in time, while the vertical layers control which items to appear superimposed on each other. For example, if you are having two media items, media1 and media2. If you need them to appear one after the other, you can add them both in the same layer while making sure that the second one starts only when the first one is finished, but if you want the audio of one item to appear along with the video of the other item, then you need to place them in two separate layers and make them start at the same time.

In the image above, we are having two layers, with our video in layer 1, while layer 0 contains a text item.

In order to add the above text item, we need first to click on the “+ Event” tab on the right, then click on text. A new text item will then be added to layer 0, and you will be given some fields to fill for that new item. The most important field of course is the “text” field, where you can write what to be written in your new text area. You can also set the start and end time for its appearance on the screen, or you can do the same thing by dragging and resizing the text item shown in layer 0. You can also change the text’s font, size and colour. In our case here, we added the following text in the beginning of the video, “Time’s Best Inventions of 2013”, then we moved the video item a bit to the right to appear right after the text disappears.

To edit any item you have, just click on it in the layers pane and its settings will be shown in the Events section on the right. To delete an item, just drag it to a new layer, and then delete that layer.

In the minute, 1:25, they speak about the invention of invisible skyscrapers in South Korea. So, let’s show a map with the location of South Korea on top of the video then.

We first need to click on the “+ Event” tab on the right, then click on the “Googlemap” item. This time a map item will be added into a separate layer. We already start the video 4 seconds late after the introductory text. Thus, we need the map to appear at the minute 1:29 (1:25 + 0:04). Let’s type in that value manually, and also let’s keep the map on screen for 10 seconds. In the location field let’s type “South Korea” and set the map type to “Road Map” and the zoom level to 3. We then can change the size and the position of the map item on the screen by dragging and resizing it. We also can double click on the map item to manually change its pan and zoom.

In a similar fashion to adding Text and Google Maps, you can also add images, speaker popups, and  3D models from Sketchfab. You also should find it easy to pause and skip parts of your embedded multimedia content.

When done, you need to give your project a name then click on the save button as shown above.

Finally, here comes the fun part where you can embed the output video along with the interactive multimedia on top of it into your own blog or journal. To do so, you have to click on “Project”, then copy and paste the HTML code shown in the “Embed” tab into your own blog or web page.

flattr this!

30 Dec 15:48

K-means Clustering 86 Single Malt Scotch Whiskies

by Luba Gloukhov
Pachevalier

Très bon exemple

by Luba Gloukhov

The first time I had an Islay single malt, my mind was blown. In my first foray into the world of whiskies, I took the plunge into the smokiest, peatiest beast of them all — Laphroig. That same night, dreams of owning a smoker were replaced by the desire to roam the landscape of smoky single malts.

As an Islay fan, I wanted to investigate whether distilleries within a given region do in fact share taste characteristics. For this, I used a dataset profiling 86 distilleries based on 12 flavor categories.

The data was obtained from https://www.mathstat.strath.ac.uk/outreach/nessie/nessie_whisky.html.

whiskies 

I first went ahead and ensured that the dataset had no missing observations. I generated a subset of the data that included only the 12 flavor variables, rescaled for comparability using scale().

sum(is.na(whiskies))  # no missing observations
## [1] 0
whiskies_k 

K-means clustering assigns each observation membership to one of k clusters in such a way that minimizes the distance between each observation and it's cluster's mean. K-means clustering requires us to specify the number of clusters. Below, we iterate through kmeans() with clusters argument varying from 1 to maxCluster and plot the within groups sum of squares for each iteration.

ssPlot 

Rplot01

Naturally, the within groups sum of squares decreases as we increase the number of clusters. However, there is a trend of diminishing marginal returns as we increase the number of clusters. I select the number of clusters based on the point at which the marginal return of adding one more cluster is less than was the marginal return for adding the clusters prior to that.

fit 

Cluster centers can inform on how taste profiles differ between clusters.

fit$centers
##      Body Sweetness    Smoky Medicinal Tobacco   Honey   Spicy   Winey
## 1 -0.6255   0.10478 -0.39342   -0.1825 -0.3606 -0.3720 -0.3647 -0.5765
## 2 -0.2541   0.05944 -0.04039    0.1214  2.7407 -0.2862  0.3606  0.2036
## 3  0.5113   0.05944  0.04733   -0.3071 -0.3606  0.7438  0.3220  0.7721
## 4  1.7163  -1.10234  2.46845    2.8149  1.7069 -1.2630  0.3606 -0.5111
##     Nutty   Malty   Fruity   Floral
## 1 -0.2395 -0.2673  0.06586  0.29654
## 2 -0.3632  0.5792 -0.38788  0.15866
## 3  0.4297  0.3624  0.13698 -0.07171
## 4 -0.3632 -0.7455 -0.81553 -1.79062

Based on these centers, I anticipate that my love for the full bodied, smoky and medicinal lies in cluster 4.

subset(whiskies, fit.cluster == 4)
##    Distillery Body Sweetness Smoky Medicinal Tobacco Honey Spicy Winey
## 4      Ardbeg    4         1     4         4       0     0     2     0
## 22   Caol Ila    3         1     4         2       1     0     2     0
## 24  Clynelish    3         2     3         3       1     0     2     0
## 58  Lagavulin    4         1     4         4       1     0     1     2
## 59   Laphroig    4         2     4         4       1     0     0     1
## 78   Talisker    4         2     3         3       0     1     3     0
##    Nutty Malty Fruity Floral   Postcode Latitude Longitude fit.cluster
## 4      1     2      1      0  \tPA42 7EB   141560    646220           4
## 22     2     1      1      1  \tPA46 7RL   142920    670040           4
## 24     1     1      2      0   \tKW9 6LB   290250    904230           4
## 58     1     1      1      0   PA42 7DZ   140430    645730           4
## 59     1     1      0      0   PA42 7DU   138680    645160           4
## 78     1     2      2      0   IV47 8SR   137950    831770           4

I identified the most representative whisky of each cluster by seeking out the observation closest to the center based on all 12 variables.

whiskies_r 
##      Distillery Body Sweetness Smoky Medicinal Tobacco Honey Spicy Winey
## 42 Glenallachie    1         3     1         0       0     1     1     0
## 70 RoyalBrackla    2         3     2         1       1     1     2     1
## 1     Aberfeldy    2         2     2         0       0     2     1     2
## 4        Ardbeg    4         1     4         4       0     0     2     0
##    Nutty Malty Fruity Floral   Postcode Latitude Longitude fit.cluster
## 42     1     2      2      2   AB38 9LR   326490    841240           1
## 70     0     2      3      2   IV12 5QY   286040    851320           2
## 1      2     2      2      2  \tPH15 2EB   286580    749680           3
## 4      1     2      1      0  \tPA42 7EB   141560    646220           4

The dataset contains coordinates that I used to investigate how flavor profiles differ geographically. The dataset's Latitude and Longitude variables are coordinates defined according to Great Britain's Ordnance Survey National Grid reference system. I converted the coordinates to standard latitude and longitude in order to plot them using ggmap.

library(maptools)
## Loading required package: sp Checking rgeos availability: TRUE
library(rgdal)
## rgdal: version: 0.8-14, (SVN revision 496) Geospatial Data Abstraction
## Library extensions to R successfully loaded Loaded GDAL runtime: GDAL
## 1.10.1, released 2013/08/26 Path to GDAL shared files:
## C:/Revolution/R-Enterprise-6.2/R-2.15.3/library/rgdal/gdal GDAL does not
## use iconv for recoding strings. Loaded PROJ.4 runtime: Rel. 4.8.0, 6 March
## 2012, [PJ_VERSION: 480] Path to PROJ.4 shared files:
## C:/Revolution/R-Enterprise-6.2/R-2.15.3/library/rgdal/proj

whiskies.coord 

Alternatively, the ggmap package ships with a geocode function which uses Google Maps to determine the lat/lon based on a character string specifying the location.

library("ggmap")
## Loading required package: ggplot2
whiskies 

whiskyMap 
## Map from URL :
## http://maps.googleapis.com/maps/api/staticmap?center=Scotland&zoom=6&size=%20640x640&scale=%202&maptype=terrain&sensor=false
## Google Maps API Terms of Service : http://developers.google.com/maps/terms
## Information from URL :
## http://maps.googleapis.com/maps/api/geocode/json?address=Scotland&sensor=false
## Google Maps API Terms of Service : http://developers.google.com/maps/terms


whiskyMap + geom_point(data = whiskies, aes(x = whiskies.Latitude, y = whiskies.Longitude, 
    colour = fit.cluster, size = 2))

Rplot02

I zoomed in and examine which Distilleries lie within the Islay region.

whiskyMap 
## Map from URL :
## http://maps.googleapis.com/maps/api/staticmap?center=Islay&zoom=10&size=%20640x640&scale=%202&maptype=terrain&sensor=false
## Google Maps API Terms of Service : http://developers.google.com/maps/terms
## Information from URL :
## http://maps.googleapis.com/maps/api/geocode/json?address=Islay&sensor=false
## Google Maps API Terms of Service : http://developers.google.com/maps/terms


whiskyMap + geom_point() + geom_text(data = whiskies, aes(x = whiskies.Latitude, 
    y = whiskies.Longitude, label = Distillery, color = fit.cluster, face = "bold"))
## Warning: Removed 78 rows containing missing values (geom_text).

Rplot03

The results indicate that there is a lot of variation in flavor profiles within the different scotch whisky regions. Note that initial cluster centers are chosen at random. In order to replicate the results, you will need to run the following code before your analysis.

set.seed(1)

Further data analysis would be required to determine whether proximity to types of water sources or terrain types drive common flavor profiles. This could be done by obtaining shape files and adding them as an additional layer to the ggmap plot.

For me, I have identified my next to-try single malt. Talisker is still within the familiar realm of cluster 4 but a little more malty, fruity and spicy. Sounds like the perfect holiday mix.

30 Dec 13:48

Des prix littéraires très masculins

by Observatoire des inégalités
Pachevalier

Complètement stupide puisque ça n'est pas rapporté au nombre de femmes écrivains. Il faudrait le odd ratio.

Au total, sur 663 prix littéraires décernés depuis le début du 20e siècle, 16 % ont été attribués à des écrivaines, soit 108 femmes lauréates. L'égalité est encore lointaine en littérature, comme dans bien d'autres domaines.

Notons tout de même qu'en 2013, sur 10 prix, quatre ont été décernés à des femmes (les prix Médicis, Femina, Flore et Interallié), mais les prix les plus vendeurs (Goncourt, Renaudot, Goncourt des lycéens) reviennent toutefois à des hommes.

Par ailleurs, les jurys des prix littéraires sont souvent très masculins (hors Femina, composé d'un groupe de femmes). L'Académie française, la plus prestigieuse institution culturelle, n'a compté que 8 femmes sur 725 membres depuis sa création (1 %) ; l'Académie Goncourt, 5 femmes membres pour 53 hommes (8,6 %). Il faut souligner que les jurys 2013 des prix Décembre et Médicis frôlent la parité avec, pour le premier, 5 femmes sur 12 jurés et pour le second, 4 femmes sur 9.

Le nombre de femmes auteures éditées a toujours été inférieur à celui des hommes, d'où leur faible part dans les prix décernés. Outre que l'on peut se demander pourquoi (écrivent-elles vraiment moins ou leur production est-elle jugée moins digne d'intérêt ?), c'est de moins en moins vrai aujourd'hui. Le monde littéraire n'est cependant pas exempt de misogynie.




Part des femmes dans les prix littéraires
Nombre de prix
Nombre d'auteures
Part de femmes
en %
Nobel de littérature 110 13 12
Goncourt 110 10 9
Femina 103 39 38
Grand prix du roman de l'Académie Française 101 12 12
Renaudot 88 13 15
Interallié 80 8 10
Médicis 56 12 21
Décembre 15 1 7
Total 663 108 16
Source : calculs de l'Observatoire des inégalités - 2013

Photo / © Piano107 - Fotolia.com

30 Dec 13:42

Is skiing the world's most dangerous sport?

by Mona Chalabi
Pachevalier

Graphique stupide puisqu'il n'est pas rapporté à l'intensité des différentes pratiques.

Injuries data reveals which sports carry the greatest risks


30 Dec 09:33

Where UK immigrants were born: 1951-2011

by Mona Chalabi

This simple but effective infographic puts the 2011 census in context by looking at changes in the top ten non-UK countries of birth since 1951. It shows that 2011 was the first decade in half a century that there were more British residents were born in India than in Ireland


30 Dec 09:18

Libre Accès : quand l'UNESCO montre l'exemple

by aKa

Excellente nouvelle, l’UNESCO montre l’exemple et fait elle-même ce qu’elle préconise aux autres en rendant disponibles ses propres publications sous licence Creative Commons.

Elle vient ainsi d’annoncer la création d’un portail regroupant déjà plus de 300 documents. Choix sera fait de privilégier la plus libre des licence Creative Commons, la CC By-SA, qui, on le sait, est la mieux adaptée au secteur éducatif (financé sur fonds publics).

3 exemples au hasard : S’adapter au changement climatique et éduquer pour le développement durable, Établir une proposition d’inscription au patrimoine mondial et Un référentiel TIC de compétences pour les enseignants.


UNESCO - REL


L’UNESCO lance son dépôt Open Access sous licence Creative Commons

UNESCO launches Open Access Repository under Creative Commons

Cable Green - 18 décembre 2013 - Creative Commons Blog
(Traduction : Aurélien Pierre)

L’UNESCO a annoncé l’ouverture d’un nouveau dépôt Open Access (NdT : Open Access ou Libre Accès) rendant disponibles plus de 300 rapports numériques, livres et articles, sous licences Creative Commons IGO (Intergovernmental Organizations).

D’après le communiqué de presse de l’UNESCO :

Actuellement, le dépôt contient des travaux dans 12 langues, incluant des rapports majeurs de l’UNESCO et des publications de recherches. De même que les 300 publications en accès libre déjà présents, l’UNESCO va proposer en ligne des centaines d’autres titres et rapports importants. Couvrant un large spectre de sujets en provenance de toutes les régions du monde, ces connaissances peuvent à présent être partagées au grand public, aux professionnels, aux chercheurs, aux étudiants et aux responsables politiques… sous une licence libre.

L’UNESCO va continuer à élargir sa bibliothèque de ressources libres avec certaines anciennes publications et avec tous les nouveaux travaux suivant l’adoption de sa politique Open Access, en avril 2013. Depuis le 31 juillet 2013, toutes les nouvelles publications de l’UNESCO sont libérées avec l’une des licences CC IGO et seront envoyées sur le dépôt Open Access. La majorité des ressources de l’UNESCO seront libérées sous licence CC By-SA (Paternité - Partage à l’identique).

Mention spéciale également à l’UNESCO pour avoir implémenté la plupart des recommandations dans sa Déclaration des Ressources Éducatives Libres, en 2012 à Paris :

d. Promouvoir la compréhension et l’utilisation de dispositifs d’octroi de licences ouvertes.
g. Encourager le développement et l’adaptation des REL dans une grande diversité de langues et de contextes culturels.
i. Faciliter la recherche, la récupération et le partage des REL.
j. Encourager l’octroi de licences ouvertes pour les matériels éducatifs produits sur fonds publics.

En ouvrant ses publications sous licence libre, l’UNESCO ne rend pas seulement accessibles et gratuites les connaissances qu’elle créé, mais elle plus importante encore elle donne ainsi l’exemple et montre la voie à suivre pour ses 195 nations membres (et 9 membres associés), dans les débats politiques actuels pour le partage sous licences libres des ressources financées sur fonds publics. Le message est clair : c’est une bonne idée que d’adopter des politiques d’ouverture des contenus qui augmentent l’accès et réduisent les coûts des ressources éducatives, scientifiques et culturelles.

Félicitations UNESCO !

12 Dec 14:26

La masculinisation des naissances en Europe orientale

Population & Sociétés, par Christophe Z. Guilmoto et Géraldine Duthé, n°506
06 Dec 10:14

Cleaning your data in Datawrapper

by admin

To help Datawrapper understand and correctly display your data, you need to clean it first. We recommend that you do this in your favorite spreadsheet application. However, sometimes things need to be done quickly, so this tutorial explains how you can do this in Datawrapper.

First you need to know that Datawrapper supports three different column types for text, numbers and dates. For text columns no cleaning is required, as these values are not needed to be parsed. Text columns is the fallback if number and date parsing fails.

Here’s a typical example of a dataset with different column types. As you see the date column is shown in green and the number columns are shown in blue. You probably also noticed the two cells with a light red background, these are cells that could not be parsed correctly.

screenshot 2013-12-04 um 13.19.06

 

 

The last year value could not be parsed because it also contains the text “(thru October 15)“. And the number 1740 accidentally contains a space (yes, things like this happen). As a result, the chart doesn’t look as it should. The mis-parsed number is not displayed at all, and the x-axis cannot be displayed as proper date axis.

screenshot 2013-12-04 um 13.41.19

 

Now to fix this you just need to click the cells twice and enter the corrected value. The operation was successful when the red background disappears.

clean_data

Now the line chart looks much better. Of course now the chart is lacking the information that the data for 2013 is only recorded thru October 15. We recommend to put this in chart description.

screenshot 2013-12-04 um 13.49.14
25 Nov 09:28

L'heure du revenu de base est-elle venue?

by alexandre
Pachevalier

Peu crédible

Il y a quelques semaines, un camion rempli de millions de pièces de monnaie a été déversé devant le parlement suisse; en même temps, a été apporté la liste de 125 000 signatures nécessaires pour la mise en place d'un revenu de base en suisse. Son montant n'a pas été précisé, mais les promoteurs de l'initiative proposent 2500 francs suisses par mois par adulte, et 625 par enfant de moins de 18 ans; soit environ respectivement 1 900 et 500 euros. Cela peut sembler beaucoup mais la Suisse est un pays riche, et ces montants correspondent au seuil de pauvreté du pays. En France, l'équivalent correspondrait à des montants d'environ 950 et 300 euros. Du coup, cette idée ancienne refait débat. Elle a les honneurs du New York Times, il y a une initiative européenne sur le sujet, on en parle dans tous les pays. En ces temps de débats mornes, d'austérité et de croissance en berne, et si le revenu de base était une utopie raisonnable? quelques éléments du débat.

Qu'est-ce que le revenu de base?

le revenu de base, ou revenu inconditionnel, consiste à verser à chaque membre d'une communauté politique un revenu inconditionnel permettant à chacun de vivre au dessus du seuil de pauvreté. Le mot clé est inconditionnel. Cela ne dépend pas du fait de travailler ou non, de conditions d'âge, ni même de conditions de revenus; le sdf reçoit exactement le même montant que Liliane Bettencourt au titre du revenu de base; en France, cela donnerait environ 2500 euros par mois pour une famille de deux parents et deux enfants, 900 euros par mois pour un adulte. Ensuite, les gens peuvent compléter ou non cette allocation avec des revenus supplémentaires, et celle-ci est soumise à la fiscalité générale comme tous les revenus.

Combien ça coûte?

Très cher. Si l'on considère la population française, et les montants ci-dessus, cela correspond à environ 650 milliards d'euros par an; Soit un tiers du PIB total. Il faut cependant nuancer ce montant en se souvenant que cela viendrait se substituer à toute une série de dépenses sociales déjà existantes. Le RSA, la prime pour l'emploi, les allocations familiales, la partie des retraites jusqu'au montant de base, allocations chômage, etc. Par ailleurs, le dispositif a le grand avantage d'être très simple à administrer, ce qui permettrait de réaliser des économies budgétaires par rapport à tous les dispositifs existants. Pour certains de ses promoteurs, cela permettrait aussi de considérablement flexibiliser le fonctionnement de l'économie; il deviendrait par exemple possible de libéraliser le fonctionnement du marché du travail, de réduire le montant du salaire minimum, supprimer de nombreuses régulations dommageables à l'emploi, de supprimer la distinction activité et retraite, toute une série d'aides à l'emploi peu efficaces, sans conséquences dommageables pour les salariés qui ne seraient plus soumis à l'obligation de travailler pour vivre.

Mais il ne faut pas se leurrer : cela représenterait un coût très important, une extension majeure de l'état-providence sous une forme très différente du système actuel. Cela dit, c'est moins radical qu'il n'y paraît, parce que le système actuel coûte déjà très cher, pour des résultats décevants par rapport à son coût.

Plus personne ne voudra travailler!

C'est la crainte principale des adversaires du dispositif. Sans la pression de devoir travailler pour vivre, l'incitation à travailler disparaîtrait, et avec elle les revenus nécessaires pour financer le revenu de base. Il se trouve que cette idée a été testée; le revenu de base est l'une des rares utopies ayant fait l'objet d'expérimentations dans les années 70. En versant à des gens choisis au hasard une allocation correspondant au seuil de pauvreté, il est apparu une réduction du temps de travail de l'ordre de trois semaines à un mois par an. Peu de gens accepteront de faire des emplois désagréables et mal payés s'ils touchent déjà le revenu de base. Pour les promoteurs de l'idée, c'est une conséquence désirable du système; offrir aux gens la liberté de choisir vraiment de travailler, sans la contrainte de survie, les émanciperait réellement. Un revenu de base au niveau du seuil de pauvreté, par ailleurs, n'est pas l'abondance. De nombreuses personnes souhaiteraient compléter cela en travaillant à plein temps. Les employeurs devraient alors offrir des emplois et des conditions de travail réellement attrayants pour attirer du personnel.

Certes, on risque de voir des segments de la populations perdre le contact avec le travail de façon durable, sur des générations. Mais les diverses réformes des années récentes, consistant à accroître les incitations à travailler, n'ont pas eu d'effet très probant. Subordonner les allocations au travail conduit effectivement les pauvres à travailler, mais dans des emplois faiblement productifs et peu rémunérés, dont il est très difficile de sortir. On remplace la trappe à inactivité par une trappe à pauvreté, pour satisfaire des a priori idéologiques contestables.

Se pose également la question de l'avenir du travail. De nombreux économistes craignent que l'évolution technologique ne conduise à rendre de nombreuses personnes aussi inemployables que le sont devenus les chevaux au 20ième siècle. Ces craintes ne sont pas certaines mais il n'est pas inutile de réfléchir à des utopies concrètes si le travail vient effectivement à disparaître petit à petit, sauf pour une minorité.

Pourquoi en parle-t-on si peu?

Le revenu de base est poussé par un ensemble assez hétéroclite. Des écologistes, mais aussi des libéraux, ou encore Christine Boutin ou Dominique de Villepin en France se sont déclarés favorables à la mesure. Lorsqu'un écologiste apprend qu'il a une idée commune avec Christine Boutin, l'esprit de clan fait qu'il pense qu'il doit y avoir un malentendu. Partout, c'est le même attelage improbable qui est favorable au revenu de base, constitué d'activistes d'extrême-gauche utopistes et de libéraux affirmés (Milton Friedman ou Charles Murray se sont déclarés favorables à la mesure). Pour les premiers, il s'agit d'un moyen de mettre fin au capitalisme, pour les seconds, de faire disparaître la bureaucratie de l'état-providence. Pas étonnant qu'ils aient du mal à constituer un front uni. L'idée intéresse aussi des scientifiques plus nuancés, comme le belge Philippe Van Parijs ou l'anglais Tony Atkinson. Mais elle reste en dehors de la fenêtre d'Overton et n'est tout simplement pas débattue.

Sur le papier, elle semble séduisante et générerait probablement de nombreux problèmes en pratique; l'idéologie managérialiste de notre temps n'est guère favorable aux idées simples, qui sont rapidement noyées dans la complexité et les arbitrages politiques. Mais c'est une idée qui a plus de mérites que son absence du débat public ne suggère. Le referendum suisse sur le sujet lui donne un éclairage bienvenu.

12 Nov 13:14

RStudio OS X Mavericks Issues Resolved

by jjallaire

When OS X Mavericks was released last month we were very disappointed to discover a compatibility issue between Qt (our cross-platform user interface toolkit) and OS X Mavericks that resulted in extremely poor graphics performance.

We now have an updated preview version of RStudio for OS X (v0.98.475) that not only overcomes these issues, but also improves editor, scrolling, and layout performance across the board on OS X (more details below if you are curious):

http://www.rstudio.com/ide/download/preview

We were initially optimistic that we could patch Qt to overcome the problems but even with some help from Digia (the organization behind Qt) we never got acceptable performance. Running out of viable options based on Qt, we decided to bypass Qt entirely by implementing the RStudio desktop frame as a native Cocoa application.

OS X Mavericks issues aside, we are thrilled with the result of using Cocoa rather than a cross-platform toolkit. RStudio desktop uses WebKit to render its user-interface, and the Cocoa WebKit Framework is substantially faster than the one in Qt.

Please try out the updated preview and let us know if you encounter any issues or problems on our support forum. For those that prefer to wait for the final release of v0.98 we expect that to happen sometime during the next couple of weeks.


30 Oct 19:19

My Vision Statement in Harvard Business Review

by Catherine Mulbrandon
Harvard Business Review November 2013

Harvard Business Review November 2013

It's out. In the November issue of the Harvard Business Review, you can find my Vision Statement "America's Incredible Shrinking Information Sector" (data/analysis provided by Hank Robison at EMSI) based on the industry sector treemaps I created for An Illustrated Guide to Income in the United StatesSee the interactive version online at HBR.com

     
 
 
21 Oct 08:30

What does the 2011 Census tell us about diversity of languages in England and Wales?

What does the 2011 Census data tell us about the diversity of languages spoken across England and Wales? University College London population geographer Guy Lansley explains what his visualisations tell us about some of Britain's most cosmopolitan cities

We've seen how language distribution data across England and Wales from the 2011 Census implies a cosmopolitan mixture of residents but by plotting the most frequent main language spoken (excluding English), population geographer Guy Lansley has illustrated the extent to which London remains true to its name as Britain's 'global city'. Here he explains how he created the maps and what they tell us about diversity of languages in England and Wales.

How I created the visualisations

The map conveys the central points of every small census area known as output areas with each colour denoting the most frequent 'mainly spoken language excluding English' based on data collected by the 2011 Census. Output areas generally represent about 300 people or 125 households.

"What is your main language?" was just one of the questions asked by the 2011 Census in England and Wales and the results published by the Office for National Statistics (ONS) earlier this year included data on almost 100 verbally spoken languages with 4.1m people reporting a main language other than English (or Welsh if they lived in Wales).

It is important to note that the maps only show 'main language', they do not indicate an absence an English speaking skills.

More than 80 languages are represented in the London map

In London alone, just over 690,000 people considered a European language which wasn't one of British origin as their main language and almost 150,000 of these were Polish speakers.

In total, 1.7m recorded a language other than English as their main language in London. More than half a million identified a south Asian language as their main language in the 2011 Census and an additional 100,000 identified an east Asian language. More than 130,000 people identified their main language as one native to Africa.

In the above map, the colour of each point denotes the most frequently recorded language (excluding English) from the 2011 Census for that particular output area. Accordingly, over 80 languages are represented in one visualisation as the local dominance of particular languages varies across Greater London.

The spatial distribution of spoken languages in London is most remarkable; some languages are so concentrated it is possible to distinguish vast communities, many of which span entire boroughs. These include Turkish in east Enfield, Polish in Ealing, Bengali (with Syheti and Chatgaya) in Tower Hamlets.

In the Inner London, Arabic is particularly concentrated in North Kensington and Westbourne Green, whilst French is most frequent in South Kensington and Fulham. Districts such as Lambeth and Southwark reflect a cultural mixture of various European languages, particularly Spanish and Portuguese.

Of course, much of these spatial distributions are consequential of the residential segregations between different migrant groups in London. Whilst, this map will miss those migrants who already spoke a variant of English or those who now feel more comfortable speaking English as a main language, it identifies the remaining magnitude of those who have retained their home languages or have passed them on to younger generations.

It is even possible to distinguish various smaller migrant communities in London from the local concentrations of particular languages. This is exemplified by the dominance of the Korean language in New Malden, Kingston-upon-Thames - a neighbourhood which hosts one of the largest South Korean emigrant communities in Europe.

The map reinforces London as a diverse and cosmopolitan city, hosting various different cultural and ethnic communities, which have originated from all over the world. It also emphasises the heterogeneity between different language speakers as their distributions conform to the distinctive spatial distributions of different expatriate communities across Greater London.

England and Wales

Minority languages native to the British Isles including variants of Gaelic, Cornish and Welsh (if the survey was not conducted in Wales) are still clinging on to dominance in rural areas across England and Wales.

Another city with a distinctive lingual spatial composition is Bristol. The city comprises of a densely populated Somali language dominated segment east of the city centre, whilst the rest of the city is most commonly inhabited by speakers of Eastern European languages - Polish being the most frequent - when English is not considered.

These languages are also most common in many parts in the north of England - largely due to the very small numbers of international migrants in these areas. For instance the percentage whose main language was foreign to the British Isles is under 3% in the north-east of England, whilst this value is roughly 7.5% for the whole of England and Wales, and 22% for London. It is no surprise that the cities reflect a melting pot of languages due to their presence as a magnet of international migration.

Concentrations and compositions of foreign languages contrast between entire cities and regions. Take Liverpool and Manchester, for example. Liverpool displays concentrations of Eastern European Languages buffered by instances of other UK languages retaining local dominance, and a small concentration of east Asian language speakers in the city centre.

Manchester

Manchester has had far greater success attracting international migrants and consequentially it is far more multilingual. In fact Liverpool's population of non-English main-language speakers is less than 30,000 whilst Manchester has attracted almost 80,000. The centre features small clusters of Chinese speakers , whilst the Somali language dominate the neighbourhoods nearby to the south including Moss Side.

The influence of Pakistani migrants is most visible from large expanses of southern Manchester dominated by Urdu. Indian settlers remain distanced from Pakistanis with the largest gatherings of Indian languages in Greater Manchester concentrated in Oldham.

Yorkshire

In Yorkshire, Bradford hosts an eclectic mix of south Asian languages, whilst neighbouring Leeds experiences more diverse compositions of languages with small clusters of east Asian, west Asian and south Asian languages dotted around the centre. Whilst, other European languages dominate the lingual landscape further afield.

Guy Lansley is a teaching fellow in population geography at University College London.


theguardian.com © 2013 Guardian News and Media Limited or its affiliated companies. All rights reserved. | Use of this content is subject to our Terms & Conditions | More Feeds

18 Oct 15:24

Every person in England and Wales on a map

by Chris Cross
Pachevalier

Très bien

According to the 2011 census 56,075,912 people live in England and Wales. We've drawn every person as a dot in their approximate location. The results give a beautiful picture of population density across the country.


15 Oct 08:11

Fama, Hansen et Shiller, prix Nobel d'économie 2013

by alexandre

Voici une anticipation certaine : le prix Nobel d'économie 2013 va susciter énormément de commentaires mal informés. Vous lirez qu'il est contradictoire de le décerner au pro-marchés financiers, thuriféraire de "l'efficience des marchés" Eugène Fama, et à Robert Shiller, "dénonciateur des bulles financières et de l'exubérance irrationnelle" des marchés. Vous ne lirez pas grand chose sur Lars Hansen, et beaucoup de bavardage mal informés sur les deux autres. En réalité, ce Nobel est extrêmement cohérent, et récompense trois chercheurs pour lesquels la réalité des données doit primer.

Eugène Fama et l'efficience des marchés

Eugène Fama s'ennuyait tellement à l'université, au début des années 60, à suivre des études de français (sic), qu'il décida de s'inscrire à un cours d'économie. La matière lui a plu au point de décider de s'y spécialiser et d'aller faire une thèse à l'Université de Chicago. Là bas, il a rencontré les économistes qui étaient en train de créer le domaine de la finance. le domaine était en plein effervescence, grâce à des outils théoriques, des techniques mathématiques (analyse des données, optimisation). Fama avait été en particulier très impressionné par un visiteur de l'université, le mathématicien Benoît Mandelbrot, qui cherchait à appliquer les mathématiques fractales à la finance. La thèse de Fama portait sur l'idée la plus dangereuse de l'analyse économique - l'hypothèse d'efficience des marchés.

"L'hypothèse d'efficience des marchés" est l'idée que la concurrence entre investisseurs conduit les prix des actifs sur les marchés financiers à incorporer toute l'information disponible. Imaginez que vous entendiez à la radio que telle entreprise vient de remporter un gros marché; pas la peine de vous embêter à acheter ses actions. Le temps de décrocher votre téléphone, d'autres auront déjà acheté jusqu'à faire monter le prix à un niveau qui incorpore l'effet sur les gains futurs de cette nouvelle. Si les prix incorporent toute l'information disponible lorsqu'elle arrive, ils évoluent selon une marche au hasard, un peu comme un ivrogne qui rentre chez lui en se cognant dans les murs, puisque l'information nouvelle est par définition inconnue à l'avance. Et s'il n'est pas possible de prévoir l'évolution du marché, la seule façon d'accroître ses revenus est de prendre plus de risques, en espérant que cela paie.

Ce que faisait Fama, c'est tester cette hypothèse et montrer qu'elle cadrait bien avec les données disponibles sur les prix dans les années 60. Ceux-ci semblaient vraiment suivre une marche au hasard, et incorporer les informations disponibles sur les prix futurs, à quelques exceptions mineures près.

L'efficience des marchés signifie dans sa forme forte que les prix des titres reflète la valeur fondamentale, c'est à dire les prix futurs; cette version est contestable, comme on va le voir. Sa version "faible" signifie elle qu'il est impossible à un investisseur individuel en moyenne de faire mieux que le marché. Et c'est probablement l'idée la plus utile que vous entendrez de la bouche d'un économiste de toute votre vie.

Elle signifie que si vous voulez placer votre argent, vous allez perdre votre temps à chercher à acheter et vendre "au bon moment". Que lorsque le conseiller clientèle de votre banque vous propose "un produit maison qui va vous rapporter plus que le marché" vous pouvez l'envoyer promener. Que vous n'avez pas besoin de lire les articles très ennuyeux vous recommandant l'achat de telle ou telle action. Que les multiples publicités que vous lisez sur de nombreux sites internet vous promettant de devenir trader et de gagner une fortune sont des escroqueries. Que vous n'avez qu'une seule chose à faire pour gagner plus d'argent que 70% des gens qui épargnent, et dont l'épargne a une performance inférieure à celle du marché : c'est acheter des fonds qui suivent les indices boursiers passivement. Et épargner régulièrement.

A ce titre, l'efficience des marchés est une idée de salubrité publique. Si plus de gens la connaissaient et la suivaient, ils géreraient mieux leur épargne, en étant bien plus tranquilles, et sans enrichir de parasites. Comme le rappelle Chris Dillow, les marchés efficients sont comme la physique de Newton. pas totalement exacte, mais vous ne vous tromperez jamais de beaucoup en agissant comme elle le recommande.

Shiller : les marchés fluctuent trop

Mais des problèmes sont apparus progressivement dans la théorie financière. Et c'est Shiller, entre autres, qui a mis en évidence certains de ceux-ci. Par exemple, les cours des actions peuvent être interprétés comme des prévisions de dividende futurs; ou les taux des obligations à long terme comme des prévisions des taux d'intérêt de court terme futurs (si ce n'est pas le cas, il est possible avec zéro argent d'avance d'emprunter à un terme pour prêter à l'autre, et de faire fortune). Shiller a observé que les prix des actions fluctuaient bien trop par rapport aux fluctuations des bénéfices des entreprises et des dividendes versés.

Cela signifie, selon Shiller, que les marchés ont tendance à surréagir sur l'instant. Qu'il est donc peut-être possible de gagner systématiquement de l'argent en pariant contre les fortes réactions du marché - à condition d'être suffisamment patient. Shiller l'explique par l'économie comportementale : les investisseurs ont tendance à avoir des comportements mimétiques.

Dans une célèbre conférence titrée "il y a des idiots : regardez autour de vous" l'économiste Larry Summers avait expliqué que l'hypothèse des marchés efficients, poussée à l'extrême, conduisait à "l'économie ketchup" : on mesure le prix d'une bouteille d'un litre de ketchup, constate qu'il est à peu près égal à celui de deux bouteilles d'un demi-litre, et que les prix des grandes et des petites bouteilles évoluent de concert, pour en conclure que "le marché du ketchup est efficient". Mais que se passe-t-il si tous les prix en même temps sont mal évalués?

En fait, les principales critiques de l'efficience des marchés dans sa forme forte sont venues de Fama en personne. Au cours des années 90, il a produit de nombreuses études montrant que si l'on cherchait suffisamment, il était possible de trouver des variables prédisant l'évolution des marchés. Par exemple, les petites capitalisations boursières dont la valeur d'actif est élevée ont tendance à avoir une rentabilité plus élevée que la moyenne.

Shiller a popularisé ses travaux dans des livres à grand succès, en particulier "l'exubérance irrationnelle" dont la seconde édition, durant les années 2000, identifiait l'immobilier aux USA comme surrévalué. Il a aussi développé un indice, l'indice Case-Shiller, qui décrit l'évolution des prix immobiliers américains et est très suivi par les professionnels de la finance.

La récompense de la recherche empirique sur la finance

L'idée d'efficience des marchés est l'une des plus importantes de l'analyse économique. Ne pas la prendre au sérieux, et vous serez ruiné; c'est la leçon de Fama. Prenez la trop au sérieux, vous serez ruiné aussi : c'est la leçon de Shiller.

Tous deux se sont appuyés sur la même démarche : confronter les théories avec les faits. Fama a fait ce qui est le plus difficile pour un scientifique : admettre dans quelle mesure les faits lui donnaient tort, et progresser. Hansen a quant à lui développé les outils mathématiques - en particulier la méthode des moments généralisés - qui sert à évaluer empiriquement les modèles théoriques. Le fil rouge de ce Nobel est donc la recherche empirique, dans le domaine de la finance. Il est à ce titre très cohérent.

Shiller n'est pas un adversaire de la finance, bien au contraire : il a toujours préconisé de la développer, de créer des nouveaux marchés, des instruments sophistiqués - des marchés à terme du PIB futur par exemple - pour rendre la finance plus utile pour les gens. A ce titre il est un enthousiaste avocat de la finance. Fama, le lendemain du krach de 1987, distribuait à ses étudiants un article de Benoît Mandelbrot sur les fractales et la finance. Et trouve que l'idée de "bulle" n'a aucun sens tant elle est utilisée: il n'a pas tort.

Leur carrière est un exemple pour tous les économistes. Et l'efficience des marchés est l'idée la plus précieuse que vous entendrez dans un cours d'économie, pour peu que vous écoutiez bien.

 

15 Oct 08:11

Sur les plages de Lampedusa

by alexandre

Les frontières sanglantes de l'Europe

Le sénateur Marini a une qualité : lui, au moins, n'est pas hypocrite. En déclarant que les centaines de morts de Lampedusa lui faisaient regretter le colonel Khadafi, il n'a fait que résumer de façon saisissante toute la politique européenne en matière d'immigration. Ceux qui s'indignent en faisant semblant de découvrir les conséquences de ces politiques sont soit très ignorants, soit menteurs. Car, pour peu que l'on prenne la peine de s'informer, rien de ce qui s'est passé ne devrait surprendre.

La politique européenne en matière migratoire repose sur deux piliers : premièrement, le renforcement exclusif des contrôles aux frontières, pour rendre l'accès de plus en plus dangereux aux migrants potentiels. Et deuxièmement, comme les amoncellements de cadavres aux frontières de l'Europe rappellent un peu trop le mur de Berlin, faire en sorte que cela ne se voie pas trop. Le vrai drame des dirigeants européens est là : Lampedusa rend un peu trop visible l'échec de cette politique. Entre 2007 et 2012, le budget de Frontex, l'agence qui coordonne les politiques de contrôle aux frontières, a été multiplié par 4 pour atteindre 85 millions d'euros (sans préjudice des ressources considérables que les pays membres consacrent à ces contrôles). Le mur de Ceuta a coûté 200 millions d'euros. Et cela n'est jamais suffisant : lorsque 15 personnes y sont mortes en 2005, la réaction a été... d'en augmenter la hauteur. C'est une constante; lorsqu'on constate qu'une politique ne fonctionne pas, la seule solution envisagée est d'en rajouter une couche. Ainsi, la seule proposition française après Lampedusa est... d'augmenter encore le budget de Frontex. C'est la logique des shadoks : si ce que je fais ne fonctionne pas, c'est certainement que je n'en fais pas assez.

Car tout cela ne fonctionne pas. On estime à environ 800 000 le nombre d'immigrants clandestins qui entrent chaque année en Europe, pour atteindre entre 7 et 8 millions de clandestins. Le coût, dans le même temps, ne se limite pas aux coûts financiers des barrières aux frontières. Des ONG ont recensé plus de 18 000 morts aux frontières de l'Europe depuis 1988, et ce chiffre est très sous-évalué, car l'essentiel de ces morts ne sont pas identifiés. Un quart de ceux qui tentent la traversée disparaît. Des hommes, des femmes, des enfants, dont le seul crime est d'avoir voulu vivre une vie meilleure, sans infliger de préjudice à qui que ce soit. Les seuls bénéficiaires de cette politique sont les réseaux de crime organisé. Pour 4 milliards d'euros par an, l'immigration clandestine est leur seconde activité, seulement dépassée par le trafic de stupéfiants.

Effets économiques

On pourrait rétorquer que cette politique est certes cruelle, mais nécessaire : dans une Europe à la protection sociale avantageuse et au chômage élevé, accueillir plus d'immigrants exercerait un poids considérable sur la protection sociale et l'emploi; et ce, sans compter la capacité de la société à absorber des migrants culturellement très différents. Le problème, c'est que les travaux économiques sur le sujet ne confirment pas ces craintes. L'effet de l'immigration sur le marché du travail est difficile à mesurer, et a priori indéterminé. Si les migrants sont des substituts aux nationaux, ils exerceront une pression à la baisse sur les salaires et l'emploi. S'ils sont par contre complémentaires, ils auront un effet positif. Il sera par exemple plus facile d'ouvrir des cliniques et de créer des emplois d'infirmiers et de médecins si l'on dispose d'immigrants pour les activités ménagères, que les nationaux ne veulent pas faire ou seulement à un salaire très élevé. A ces effets immédiats il faut ajouter des effets indirects : les migrants ont souvent des compétences différentes de celles qui existent dans leur pays d'accueil, et sont souvent plus entreprenants que la moyenne : il faut du courage pour quitter son pays. Les immigrants sont ainsi surreprésentés dans les créateurs d'entreprise de la Silicon Valley.

Certains économistes, comme George Borjas, mesurent un effet négatif modéré sur les bas salaires des flux migratoires (environ 3% de moins en tout entre 1980 et 2000, suite à l'immigration mexicaine aux USA); d'autres, comme Giovanni Peri, considèrent qu'une hausse de 1% des entrées de migrants augmentent les salaires des résidents de 0.6 à 0.9% à long terme. Les migrants sont bien plus complémentaires que concurrents des travailleurs nationaux. Et ces mesures ne prennent pas en compte d'autres effets positifs indirects. Les immigrants permettent de réduire la pression sur les systèmes de retraites européens, mis à mal par l'évolution démographique; une alternative à la hausse de l'âge de départ légal. Les migrants sont contributeurs nets aux systèmes sociaux européens, à hauteur de 1% du budget de ceux-ci. C'est logique, car étant dans l'âge actif, ils cotisent plus qu'ils ne touchent. En Allemagne, l'organisation mondiale du travail estime qu'un migrant arrivant à 30 ans apportera une contribution nette (recettes moins dépenses) de 150 000 euros tout au long de sa vie. Par ailleurs, les migrants incitent les nationaux les plus pauvres à se former plus et à occuper plus tard des emplois mieux payés. L'immigration apporte des gains nets aux pays d'accueil.

Les problèmes d'intégration sont réels, mais ne doivent pas être surévalués. En moyenne la criminalité des migrants est inférieure à celle des nationaux (lorsqu'on excepte le délit de séjour illégal) mais avec de très fortes variations; elle est en tout cas très inférieure lorsqu'on raisonne à revenu égal. Un national pauvre a bien plus de chances de commettre des crimes et délits qu'un immigrant de même revenu. Et l'intégration s'effectue progressivement au fur et à mesure des générations, lorsqu'on cherche à la mesurer autrement qu'au travers de quelques anecdotes médiatisées.

Des politiques alternatives existent

Evidemment, ces effets positifs sont petits parce que l'immigration, aujourd'hui, est restreinte. Et il est vrai qu'il y a de nombreux candidats à l'immigration vers les pays riches, d'Europe en particulier. Selon Gallup, si tout le monde pouvait choisir dans quel pays résider, la population française augmenterait d'environ 45 millions (comme celle de la Grande-Bretagne). Il est assez évident que de tels flux seraient totalement impossibles à absorber. Mais c'est toute la perversité du débat sur l'immigration que de supposer qu'il n'y a d'alternative qu'entre la logique actuelle et l'ouverture intégrale des frontières - et que donc, la politique actuelle est la seule possible, même si elle se termine par des cadavres sur les plages siciliennes.

En réalité, des politiques alternatives, plus efficaces, existent. Des réformes du marché du travail rendraient ceux-ci à la fois  plus performants pour les nationaux, et faciliteraient l'intégration des immigrés, permettant de bénéficier des complémentarités de ceux-ci. Il y aurait surtout des moyens différents de réguler les flux migratoires que de confier ceux-ci à la Méditerranée. L'économiste Gary Becker préconise ainsi un système de visas de travail payants, par exemple 5000 euros pour un séjour de 5 ans. Cela peut sembler cher, jusqu'à ce qu'on se souvienne que les migrants paient aujourd'hui environ 2000 euros pour un passage illégal, avec tous les risques que celui-ci implique. Payer plus pour un droit de séjour établi est dans ces conditions une bonne affaire. Cela offrirait aussi l'avantage de sélectionner automatiquement les migrants potentiels les plus susceptibles de travailler pour payer leur visa. Une alternative serait l'émission d'un quota annuel de ces permis de travail temporaires. L'économiste Dani Rodrik estime ainsi qu'un tel système de permis temporaires d'une durée de 3-5 ans, limité à 3% de la population active des pays riches, générerait des gains de l'ordre de 200 milliards d'euros pour l'économie mondiale.

Mais tout cela exigerait de faire des questions migratoires un débat dépassionné, loin des fantasmes d'invasion déferlante contre lesquels il faut se protéger à tout prix. On n'en est pas là. Les dirigeants qui iront verser des larmes de crocodile à Lampedusa pour dire à quel point cela prouve l'efficacité de ce qu'ils préconisent ne méritent en tout cas que le mépris.

13 Oct 13:30

Do Political Protests Matter? Evidence from the Tea Party Movement

by Madestam, A., Shoag, D., Veuger, S., Yanagizawa-Drott, D.
Pachevalier

Très intéressant

Can protests cause political change, or are they merely symptoms of underlying shifts in policy preferences? We address this question by studying the Tea Party movement in the United States, which rose to prominence through coordinated rallies across the country on Tax Day, April 15, 2009. We exploit variation in rainfall on the day of these rallies as an exogenous source of variation in attendance. We show that good weather at this initial, coordinating event had significant consequences for the subsequent local strength of the movement, increased public support for Tea Party positions, and led to more Republican votes in the 2010 midterm elections. Policy making was also affected, as incumbents responded to large protests in their district by voting more conservatively in Congress. Our estimates suggest significant multiplier effects: an additional protester increased the number of Republican votes by a factor well above 1. Together our results show that protests can build political movements that ultimately affect policy making and that they do so by influencing political views rather than solely through the revelation of existing political preferences. JEL Code: D72.

13 Oct 13:19

Introducing TimeMapper - Create Elegant TimeMaps in Seconds

by Neil Ashton

TimeMapper lets you create elegant and embeddable timemaps quickly and easily from a simple spreadsheet.

Medieval philosophers timemap

A timemap is an interactive timeline whose items connect to a geomap. Creating a timemap with TimeMapper is as easy as filling in a spreadsheet template and copying its URL.

In this quick walkthrough, we’ll learn how to recreate the timemap of medieval philosophers shown above using TimeMapper.

Getting started with TimeMapper

To get started, go to the TimeMapper website and sign in using your Twitter account. Then click Create a new Timeline or TimeMap to start a new project. As you’ll see, it really is as easy as 1-2-3.

TimeMapper projects are generated from Google Sheets spreadsheets. Each item on the timemap – an event, an individual, or anything else associated with a date (or two, for the start and end of a period) – is a spreadsheet row.

What can you put in the spreadsheet? Check out the TimeMapper template. It contains all of the columns that TimeMapper understands, plus a row of cells explaining what each of them means. Your timemap doesn’t have to use all of these columns, though—it just requires a Start date, a Title, and a Description for each item, plus geographical coordinates for the map.

So you’ve put your data in a Google spreadsheet—how can you make it into a timemap? Easy! From Google Sheets, go to File -> Publish to the web and hit Start publishing. Then click on your sheet’s Share button and set the sheet’s visibility to Anyone who has the link can view. You can either copy the URL from Link to share and paste that URL into the box in Step 2 of the TimeMapper creation process or click on Select from Your Google Drive to just browse to the sheet. Whichever you do, then hit Connect and Publish—and voilà!

Share your spreadsheet

Embedding your new timemap is just as easy as creating it. Click on Embed in the top right corner. It will pop up a snippet of HTML which you can paste into your webpage to embed the timemap. And that’s all it takes!

Embed your timemap

Coming next

We have big plans for TimeMapper, including:

  • Support for indicating size and time on the map
  • Quickly create TimeMaps using information from Wikipedia
  • Connect markers in maps to form a route
  • Options for timeline- and map-only project layouts
  • Disqus-based comments
  • Core JS library, timemapper.js, so you can build your own apps with timemaps

Check out the TimeMapper issues list to see what ideas we’ve got and to leave suggestions.

Code

In terms of the internals the app is a simple node.js app with storage into s3. The timemap visualization is pure JS built using KnightLabs excellent Timeline.js for the timeline and Leaflet (with OSM) for the maps. For those interested in the code it can be found at: https://github.com/okfn/timemapper/

History and credits

TimeMapper is made possible by awesome open source libraries like TimelineJS, Backbone, and Leaflet, not to mention open data from OpenStreetMap. When we first built a TimeMapper-style site in 2007 under the title “Weaving History”, it was a real struggle over many months to build a responsive JavaScript-heavy app. Today, thanks to libraries like these and advances in browsers, it’s now a matter of weeks.