Shared posts

05 Jul 08:46

De 1950 à 2010 : 60 ans de prénoms en France

by admin

Quels sont les prénoms les plus donnés en France ? Le vôtre est-il original ? Combien d’homonymes sont nés la même année que vous ? Y a t’il un retour des Alphonse, Martine, Eugène, Brigitte et Marcel en 2010 ? Les prénoms en trois lettres comme Zoé, Tim ou Léa ont-ils toujours la côte ? Quels personnages de série ont inspiré le plus de parents en France pour prénommer leur enfant ? Une tonne de questions autour des prénoms dont les réponses se trouvent dans cette data-visualisation.

Dataviz des prénoms

28 Jun 16:11

Framanews : libérez vos flux ! (RIP Google Reader)

by Pyg

Framanews - Copie d'écran


Le 1er juillet prochain (J-4, donc !), Google Reader fermera ses portes.

Lancé en 2005, ce service permettait aux utilisateurs d’organiser et de lire des flux d’actualités (appelés « flux RSS ») issus de multiples sites en un seul endroit.

Plusieurs dizaines (centaines ?) de milliers d’utilisateurs se retrouvent donc « victimes » de cette fermeture annoncée il y a trois mois. Cela nous amène à nous poser deux questions :

  • Quelle confiance accorder à Google[1], qui centralise vos données en ligne ?
  • Quelle réponse le monde du logiciel libre a-t-il à proposer aux utilisateurs « mis à la porte » par Google Reader ?

De nombreuses applications libres permettant de lire des flux RSS ont vu leur développement s’accélérer ces derniers mois. Certaines nous ont semblé être d’excellentes alternatives à Google Reader. Mais comment les faire connaitre au grand public ? Comment inciter les utilisateurs a tester et valider une solution libre, plutôt que de foncer tête baissée dans la gueule grande ouverte d’un autre service privé ? Feedly, Digg, Yahoo!, et même … AOL (!) sont sur les rangs pour exploiter vos données sous forme de publicité classique ou de revente à des tiers. Pour au final fermer le service dans quelques mois ?

À sa modeste échelle, Framasoft annonce donc la mise en place de Framanews, un service de lecture de flux RSS basé sur le logiciel libre Tiny Tiny RSS. Il ne s’agit pas ici d’en faire un « concurrent » de Google Reader, qui ne résoudrait pas la question de la centralisation des données, mais bien de proposer à tout un chacun de pouvoir évaluer une alternative libre et gratuite, sans publicité, sans exploitation de vos données personnelles et que vous pouvez vous-même installer (pour une académie, un centre de recherche, etc.).

Notez bien que le projet est en bêta, que les inscriptions s’ouvrent peu à peu (afin de nous permettre de dimensionner l’infrastructure technique), et que nous prévoyons d’améliorer la documentation sur l’installation[2].

Pour vous faire patienter, nous vous proposons ici une interview de Luc, le sympathique et dynamique bénévole[3] qui est en charge de la mise en place de ce service.


Google Reader


Bonjour Luc, peux-tu te présenter ?

Bonjour. Mmh, c’est toujours dur de se présenter, mais je vais tenter quand même. Je suis un geek libriste de pas loin de 30 ans, grand fan des manchots, du Dr Who, de livres (romans, bds), du nombre 42 et des vannes pourries. On me connaît parfois sous le pseudo Sky sur le grand Ternet mais c’est plutôt rare (en dehors de LinuxFr ou de framalang, je ne sors pas beaucoup de mon lecteur de flux RSS)

Mon parcours fut assez mouvementé : 2 facs, 3 DUT, 1 Licence, clerc d’huissier, assistant de sénateur et maintenant administrateur systèmes et réseaux dans l’équipe Lothaire de l’Université de Lorraine… C’est moi qui ai appris à Jean-Claude Van Damme à faire le grand écart :)

Mon premier contact (sans le savoir) avec les logiciels libres date de l’époque où Free envoyait un cd contenant divers logiciels dont un truc qui s’appelait “Suite Mozilla” si je me souviens bien. Quand est sortie la première version de Firefox, j’y ai tout de suite adhéré, mais je n’étais pas encore prêt. C’est en 2005 qu’un ami d’enfance m’a dit « Essaye Linux, c’est vachement bien ! », ce qui m’a poussé à acheter un magazine contenant un cd d’installation d’OpenSuse. Là-dessus mon ami m’a dit « Pff, mais prends donc une Debian, ça déchire[4] ! ». Et là c’était fini, j’étais pris au piège et je n’ai plus quitté Debian, ni tout ce qui a rapport au libre. 3 ans plus tard, j’entrais en DUT d’info. Encore 5 ans de plus et j’organisais les Journées Perl 2013 (qui ont eu lieu à Nancy les 14 et 15 juin dernier).

Je fais actuellement partie de Lorraine Data Network, FAI associatif issu de l’essaimage de FDN qui milite pour un Internet Libre Décentralisé et Neutre en encourageant les gens à héberger eux-même leurs services, ou tout du moins à le faire chez des personnes de confiance… un peu comme quand Framasoft propose Framadate, Framapad, Framacalc et tous les autres Framaservices, non ? ;)

Tu t’es proposé pour mettre en place et animer le projet Framanews. Mais qu’est-ce donc que Framanews ?

Framanews est un lecteur de flux RSS en ligne. Un flux RSS est un fichier contenant les articles du site du flux dans un format normalisé qui permet d’afficher ces articles dans un lecteur, sans tout l’« emballage » du site. Cela permet de suivre l’actualité du site en question, sans y aller, ou parfois d’avoir juste un résumé des articles, ce qui permet de choisir si ça vaut le coup d’aller faire un tour sur le site. Si un certain nombre de médias du Web parlent de la fin du flux RSS car dépassé par Twitter, Google+ et consorts, je trouve qu’au contraire, c’est un excellent moyen de choisir ses sources d’informations plutôt que se laisser enfermer dans un bulle constituée de « on sait mieux que toi ce qu’il te faut ». Je ne suis certainement pas le seul à penser ainsi, vu le tollé qu’a soulevé l’annonce de la fermeture de Google Reader et le nombre de lecteurs de flux libres qu’on a vu (re)surgir ça et là : Kriss Feed, Miniflux, Leed, etc. Et surtout Tiny Tiny RSS (ttrss pour les intimes) qui a vu son développement repartir de plus belle et qui sert de base à Framanews.

J’ai légèrement forké Tiny Tiny Rss pour le franciser au maximum (mais il y a encore des bouts de texte qui m’ont échappé), certains textes comme les emails ne passant pas par le module d’internationalisation.

Mais Framanews, c’est aussi un projet « éducatif », pour (re)faire découvrir les flux RSS et présenter une alternative aux sites propriévateurs (merge de propriétaire et privateur, pour dérouter les trolls) comme (bientôt feu) Google Reader, Feedly et consorts. Le pourquoi du flux RSS, les spécificités de ttrss (interface mobile, partage de flux…), un mode d’emploi, tout ça est expliqué sur la page d’accueil du projet (surtout dans la FAQ).

Pourquoi avoir choisi ce projet-là, dans tous les framacartons[5] possibles ?

Parce que j’aime les flux RSS et que je suis un peu opportuniste : je me suis dit que la fermeture de GReader était une bonne occasion de prêcher la bonne parole du Libre. Aussi parce que je connais plutôt pas mal ttrss pour l’avoir installé pendant longtemps sur mon serveur. Je me sers de Framanews maintenant, pour voir les problèmes tout de suite et être encore plus motivé à les résoudre : vos problèmes sont aussi mes problèmes, soyez sûrs que je m’en occupe ;)

Ah ! Non ! C’est un peu court jeune homme !
On pouvait dire… oh ! Dieu ! … bien des choses en somme…
En variant le ton, —par exemple, tenez :
Agressif : « moi, monsieur, si j’avais un tel etherpad,
Il faudrait sur le champ que je le mette à jour[6] ! »
Amical : « mais il n’y a pas de css framasoft :
laissez-moi donc vous faire un boilerplate ! »

Et puis, il faut bien commencer quelque part :D

Techniquement, la mise en place a été plutôt difficile, peux-tu nous en dire plus sur les coulisses de ce projet ?

Oulà ! Alors, en ce moment, le ttrss tourne sur un des serveurs de Framasoft qui héberge d’autres services, avec la base de données sur un autre serveur, qui sert aussi à faire tourner le script de mise à jour des flux. Je n’avais au départ que le serveur Framasoft pour jouer. J’ai utilisé une base MySQL puisqu’elle était déjà installée dessus, mais avec l’ouverture progressive de la bêta, j’ai vu que ça n’allait plus du tout. Le serveur souffrait de surcharge, et pourtant c’est une bête de course. J’ai donc tuné la base MySQL, mais les problèmes sont revenus quelques jours après. J’ai ensuite tenté quelques essais infructueux de conversion des données MySQL au format PostgreSQL pour une migration en douceur, mais j’ai dû me résoudre à demander à nos courageux testeurs de migrer eux-mêmes leurs comptes, à coup d’export des flux et des préférences. Après quelques jours de répit, de divers essais de réglage des paramètres du script de mise à jours, le serveur était de nouveau en surcharge. C’est Nassim Kacha - un ami lui aussi sysadmin qui s’occupe de pas mal de base de données au boulot - qui m’a montré que la surcharge était due à des accès disques trop lents. Framasoft m’a donc fourni un nouveau jouet : un vps (Serveur Privé Virtuel) avec un disque en SSD. Tout allait bien jusqu’à ce que certains utilisateurs abusent un peu du nombre de flux : plus de 5% du total de flux pour UN utilisateur (représentant 0,5% du nombre d’utilisateurs)…

Dallas, à côté de la saga Framanews, c’est Martine à la plage !

Donc, pour l’instant, le service reste en “beta” ? Quelles sont les limitations ?

Malheureusement, oui. Suite au dernier épisode (trop de flux pour certains utilisateurs), nous avons décidé de limiter le nombre de flux par personnes (je suis en train d’écrire un système de quota de flux pour ttrss). Le système de cache de ttrss a été un peu modifié pour garder le cache plus longtemps (ce qui réduit la vitesse de mise à jour) et on ouvre les inscriptions au compte-goutte, pour nous permettre d’augmenter les capacités de la plateforme au fur et à mesure. Je n’ai pas envie que tout s’écroule de nouveau ! Une fois que j’aurais dimensionné correctement les besoins (un serveur = xxx utilisateurs), je vais tenter de transformer notre petite base de données en un cluster PostgreSQL, on repart pour des tests et on pourra enfin ouvrir les vannes en grand ! (ou pas)

Ceci dit, tant qu’on est en beta, je ne m’interdis pas de loucher vers d’autres applications de lecture de flux RSS en ligne qui pourraient mieux tenir la charge.

Si tout se passe bien au niveau technique, la prochaine limitation risque d’être le nombre de serveurs que Framasoft pourra louer. Rappelons-le, Framasoft est une association qui ne vit que par les dons de ses sympathisants. C’est pourquoi je vous invite à faire un petit tour sur http://soutenir.framasoft.org (je l’avais dit que j’étais opportuniste ! Hop, pub :D).

Au bout du compte, pourquoi utiliser Framanews plutôt que Feedly, Netvibes ou autre ?

C’te bonne blague ! Parce que c’est libre, tiens !

Mais aussi parce que Framasoft — et donc par définition Framanews aussi — cherche à libérer les internautes, en leur faisant découvrir des services qu’ils peuvent installer eux-mêmes, dans leur placard, sur leur serveur dédié, chez un hébergeur mutualisé associatif, sur un raspberry collé au dos de leur chat… De plus, nous respectons votre vie privée : la seule information dont on se sert, c’est votre adresse mail pour vous tenir au courant des évolutions du services et autres maintenances, et juste pour ça. Je pourrais aussi parler de la qualité de ttrss, de sa fonctionnalité qui permet de partager les articles que l’on aime sur un flux public[7], du superbe plugin que j’ai développé de mes blanches mains pour faciliter la navigation dans les flux (ok, c’est juste un fork d’un autre plugin)…

Je pense que la meilleure raison d’adopter Framanews, c’est de l’essayer et de comparer :)

Comment vois-tu l’avenir de ce projet ?

Moi et les autres membres de Framasoft sur une plage de sable blanc avec suffisamment d’argent pour racheter Google. Ah c’est pas payant ? Zut alors !

Je verrais bien un espace de partage des flux publics[8] des framanewseurs, un compteur des instances de ttrss que les gens auront montées parce qu’on leur en a donné envie…

Un petit mot pour la fin ?

Internet n’est pas compliqué, Internet est ce que vous en faites.


Rappel des principaux liens :

Crédit photo : Danny Sullivan (Creative Commons By)

Notes

[1] ou tout autre intermédiaire, Framasoft compris.

[2] Les utilisateurs sous Windows souhaitant tester le logiciel en standalone (sur leur poste de travail plutôt qu’en ligne) peuvent même télécharger notre WebApp TT-RSS, mise à jour pour l’occasion.

[3] S’il avait su dans quoi il mettait les doigts, il ne serait peut-être pas venu, d’ailleurs…

[4] Et c’est bien vrai !

[5] Les Framacartons ?! http://lite.framapad.org/p/framatools

[6] Oui, la mise à jour sur le champ a pris du retard à cause de Framanews, je sais, je sais.

[7] Twitter, c’est tellement 2012 !

[8] un flux public Framanews a une URL unique et tarabiscotée. Il faut que la personne vous la communique, sinon vous ne la trouverez jamais ! Par bonheur, les raccourcisseurs d’URLs existent, ce qui donne par exemple pour mon flux public : http://fiat-tux.fr/sh/LucPublRSS

27 Jun 15:11

Libération: Voyage chez Jean-Luc Godard

by cinemagodardcinema
26 Jun 14:03

Quelques notes sur la législative partielle de Villeneuve-sur-Lot

by JG

La démission de Jérôme Cahuzac du ministère du budget lui a permis, conformément à la Constitution, de redevenir automatiquement député de la 3e circonscription du Lot-et-Garonne. Ayant décidé de démissionner de son poste à la suite de l’aveu concernant les faits de fraude fiscale dont Mediapart l’avait accusé, et pour lequel une procédure judiciaire avait été ouverte, Jérôme Cahuzac a ouvert la voie à une élection législative partielle.
Le premier tour de cette élection législative partielle s’est tenu dimanche dernier. Comme on sait, le candidat socialiste, Bernard Barral, ne s’est pas qualifié pour le second tour (faute d’arriver dans les deux premiers ou d’obtenir plus de 12,5 % des inscrits), laissant s’opposer au second tour le candidat de l’UMP, Jean-Louis Costes, maire et conseiller général de Fumel, et celui du Front national, Étienne Bousquet-Cassagne, qui ne possède guère d’autre quartier de noblesse que son âge (23 ans). On a beaucoup dit que son père est un notable local (président de la chambre d’agriculture du Lot-et-Garonne), ce qui est exact, mais on a moins souligné qu’il soutient Jean-Louis Costes
Les commentateurs ont immédiatement souligné la ressemblance du scénario de Villeneuve-sur-Lot avec celui de la deuxième circonscription de l’Oise il y a quelques mois. Soit en bref : élimination du candidat PS au premier tour, dans un contexte de forte abstention, puis très forte progression du candidat FN, le menant près de la victoire. Cela est-il crédible ?
L’examen détaillé de la situation et des résultats appelle un certain nombre de commentaires.

  1. Le niveau de la participation (45 %) est certes faible, mais pas autant qu’on aurait pu s’y attendre compte tenu du contexte (affaire Cahuzac, candidat PS peu implanté…). Pour rappel, l’abstention s’établit à 54 %, contre 67 % dans le cas de l’Oise.
  2. Le candidat socialiste souffre très clairement de ne pas avoir de fief électoral dans la circonscription. Jean-Louis Costes (UMP) obtient quasiment 50 % des voix dans son canton de Fumel, alors que Bertrand Barral ne dépasse les 25 % dans aucun canton. La cause de son élimination est sans doute plus à rechercher dans cette direction que dans la désunion de la gauche pointée du doigt par la direction du PS dès l’annonce des résultats.
  3. La comparaison avec la législative de juin 2012, abondamment pratiquée, est certes impressionnante – le PS perd presque 15 000 voix, l’UMP environ 3 500 tandis que le FN en gagne presque 1 000 -, mais me semble trompeuse. En effet, alors que l’histoire de la circonscription montre que les résultats y sont toujours serrés, et suivent la tendance nationale (cf. l’historique sur Wikipedia), l’élection de juin 2012 s’écarte clairement de cette tendance en offrant un excellent score à Jérôme Cahuzac aux deux tours, sans doute dû à sa toute récente nomination comme ministre du budget. Le récit tant entendu sur l’excellence de Cahuzac qui aurait su de longue date conquérir et s’attacher la circonscription du fait de ses qualités personnelles relève donc clairement du storytelling sans aucune base empirique…
  4. Dans ces conditions, il me semble intéressant de regarder d’autres scrutins. Prenons les cantonales de 2011 : dans les cantons de cette circonscription qui étaient renouvelables et dans lesquels le FN présentait un candidat (ce qui induit un biais de sélection, j’en conviens), il obtenait 20,7 % des suffrages exprimés (contre 29 % à périmètre constant dimanche dernier), soit 9,2 % des inscrits (11,9 % dimanche dernier, encore une fois à périmètre constant). La progression est donc nette, sans être non plus absolument fulgurante. Elle s’est d’ailleurs faite dans les bureaux de vote dans lesquels le FN obtenait ses moins bons scores en 2011, qui sont par ailleurs aussi ceux dans lesquels, tendanciellement, le PS obtenait alors ses meilleurs scores (voir les graphiques ci-dessous). De là à penser qu’une partie des nouveaux électeurs FN se sont recrutés parmi des électeurs ayant voté PS en 2011, ou en tout cas parmi les électeurs des bureaux favorables au PS à l’époque…

    Vote FN en 2011 et 2013 dans la circonscription 4703.
    PSFN470311

  5. Mais le plus intéressant arrive. Dans un des cantons de la circonscription (celui de Villeneuve-sur-Lot-Sud, dont d’ailleurs Jérôme Cahuzac a été conseiller général de 1998 à 2001), le FN (représenté par Catherine Martin, militante depuis longtemps au Front qui a été écartée en faveur d’Étienne Bousquet-Cassagne) est parvenu en 2011 au second tour en duel face au PS. Au second tour, le Front a quasiment doublé son nombre de voix obtenus, passant de 20,7 % des exprimés à 39,8 %. La progression avait été à peu près constante dans tous les bureaux (voir graphique ci-dessous).
    C11FN1et2
    Alors certes, c’était contre un candidat PS, donc la situation n’est absolument pas comparable à celle à laquelle seront confrontés les électeurs de la circonscription dimanche prochain. La situation n’est pas non plus comparable à celle de l’Oise, puisque le candidat PS à appelé sans barguigner à voter UMP, et que ce dernier semble moins clivant que Jean-François Mancel. Mais on peut gager que, comme dans le cas de l’Oise, le FN va mettre toutes ses forces dans la bataille pour obtenir la meilleure progression possible entre les deux tours ; d’ailleurs, de nombreux déplacements de pointures du Front sont prévus (au passage, la campagne d’Étienne Bousquet-Cassagne est dirigée par Michel Guignot, chef de file du FN en Picardie et directeur de campagne de la candidate FN dans l’Oise – on ne change pas une équipe qui gagne ?). Et il semble vraisemblable que la progression du FN dimanche prochain soit sensible – de l’ordre de 15 à 20 points ?
  6. Dernière observation pour la route : Étienne Bousquet-Cassagne n’est pas seulement candidat ce dimanche (et aux prochaines municipales dans son village), il est aussi secrétaire départemental du FN. En cela, il est représentatif d’une stratégie de renouvellement et de management des cadres impulsée par la direction nationale du FN, visant à écarter des cadres bien implantés et expérimentés mais pas nécessairement très soumis à la direction, et à les remplacer par des jeunes en phase ascendante, sociologiquement et politiquement plus proches de la direction, disposant de moins de capital politique propre, et donc plus disposés à suivre la direction. Les échéances électorales doivent donc aussi être analysées comme des moments importants de la vie interne du parti, permettant aux uns et aux autres de jouer des coups, d’utiliser leurs ressources…

En guise de conclusion, quelques cartes des résultats de dimanche dernier. On voit en très gros (je ne connais pas du tout le territoire) que l’abstention et le vote FN sont plus élevés au sud-ouest de la circonscription, dans l’interstice entre Villeneuve et Agen, tandis que le vote UMP est plus élevé à l’est, dans la partie plus rurale de la circonscription. Le vote PS, lui, ne semble guère présenter de structure spatiale…

L'abstention

L’abstention


Le vote Barral (PS)

Le vote Barral (PS)


Le vote Costes (UMP)

Le vote Costes (UMP)


Le vote Bousquet-Cassagne (FN)

Le vote Bousquet-Cassagne (FN)

PS : merci à Antoine Jardin qui m’a communiqué les résultats par bureau de vote du scrutin !

Partager/Marquer

26 Jun 09:02

Les héros de cinéma vieillissent, pas leur love story

by Karen Bastien
Pachevalier

Très drôle


Vulture has analyzed the data of ten middle-aged leading men and the ages of the women they've wooed onscreen.


26 Jun 09:00

Task Lists in Gist

by mtodd

Task Lists are a great way to organize and break down Issues and Pull Requests into small, feasible tasks. Naturally, we want to use Task Lists to track our personal endeavors, too.

Today we're happy to make Task Lists available in Gist.

Task Lists in your Gist

Task Lists work in any Markdown file in your Gist and in any comment. Read the docs for Task Lists in GitHub-flavored-Markdown for more information.

24 Jun 13:08

Quelle entreprise peut encore faire confiance à Microsoft ? par Glyn Moody

by aKa

Le titre se suffit à lui-même ici. On pourrait ajouter aux entreprises, les institutions et les particuliers, bref tout le monde.

Non content d’avoir été accusé par le passé de réserver dans Windows des portes dérobées à la NSA, non content d’être fortement suspecté de laisser les autorités américaines collecter nos données dans Skype, Microsft est maintenant soupçonné de différer la publication de ses patchs de sécurité pour en informer d’abord les mêmes autorités américaines !

Tout DSI normalement constiué(e) devrait lire cet article et en tirer avec sa direction ses propres conclusions.


Cambodia4kidsorg - CC by


Quelle entreprise peut encore faire confiance à Microsoft ?

How Can Any Company Ever Trust Microsoft Again?

Glyn Moddy - juin 2013 - Open Enterprise (Computer World)
(Traduction : Slystone, Luo, lamessen, Antoine, sinma, Pouhiou, Sky, Fe-lor, aKa, Asta, audionuma + anonymes)

Quels que soient les détails des récentes révélations sur l’espionnage de masse de la part des États-Unis fournis par Edward Snowden dans le Guardian, il y a déjà un énorme bénéfice collatéral. D’un côté, le gouvernement des États-Unis se replie sur lui-même, niant certaines allégations en offrant sa propre version de l’histoire. Cela, et pour la première fois, nous donne des détails officiels sur des programmes dont nous n’étions (au mieux) informés que par fuites et rumeurs, voire pas du tout. De plus, la précipitation indécente et l’histoire sans cesse changeante des autorités américaines est une confirmation, si elle était encore nécessaire, que ce que Snowden a révélé est important — vous ne provoquez pas un tel tapage pour rien.

Mais peut-être encore plus crucial, d’autres journalistes, poussés par la honte et leur culpabilisation, ont finalement posé des questions qu’ils auraient dû poser des années voire des décennies plus tôt. Cela a abouti à une série d’articles extrêmement intéressants à propos de l’espionnage de la NSA, dont beaucoup contiennent des informations auxiliaires qui sont aussi intéressantes que l’histoire principale. Voici un bel exemple de ce qui est apparu durant le week-end sur le site de Bloomberg.

Entre autres choses, il s’agit de Microsoft, et d’évaluer dans quelle mesure ils ont aidé la NSA à espionner le monde. Bien sûr, cette crainte n’est pas nouvelle. Dès 1999, il était déjà dit que des portes dérobées avaient été codées dans Windows :

Une erreur d’inattention de programmeurs Microsoft a révélé qu’un code d’accès spécial préparé par l’agence nationale de sécurité étasunienne (NSA) avait été secrètement implémenté dans Windows. Le système d’accès de la NSA est implémenté sous toutes les versions de Windows actuellement utilisées, à l’exception des premières versions de Windows 95 (et ses prédécesseurs). La découverte suivait de près les révélations survenues un peu plus tôt cette année concernant un autre géant du logiciel étasunien, Lotus, qui avait implémenté une trappe « d’aide à l’information » pour la NSA dans son système Notes. Des fonctions de sécurité dans d’autres logiciels systèmes avaient été délibérément paralysées.

Plus récemment, il y eut des craintes au sujet de Skype, racheté par Microsoft en mai 2011. En 2012, il y a eu des discussions pendant lesquelles on s’est demandé si Microsoft avait changé l’architecture de Skype pour rendre l’espionnage plus facile (l’entreprise a même un brevet sur l’idée). Les récentes fuites semblent confirmer que ces craintes étaient bien fondées, comme le signale Slate :

Le scoop du Washington Post sur PRISM et ses possibilités présente plusieurs points frappants, mais pour moi un en particulier s’est démarqué du reste. The Post, citant une diapositive Powerpoint confidentielle de la NSA, a écrit que l’agence avait un guide d’utilisation spécifique « pour la collecte de données Skype dans le cadre du programme PRISM » qui met en évidence les possibilités d’écoutes sur Skype « lorsque l’un des correspondants utilise un banal téléphone et lorsque deux utilisateurs du service réalisent un appel audio, vidéo, font du chat ou échangent des fichiers. »

Mais même cela devient dérisoire comparé aux dernières informations obtenues par Bloomberg :

D’après deux personnes qui connaissent bien le processus, Microsoft, la plus grande compagnie de logiciels au monde, fournit aux services de renseignement des informations sur les bogues dans ses logiciels populaires avant la publication d’un correctif. Ces informations peuvent servir à protéger les ordinateurs du gouvernement ainsi qu’à accéder à ceux de terroristes ou d’armées ennemies.

La firme de Redmond basée à Washington, Microsoft, ainsi que d’autres firmes œuvrant dans le logiciel ou la sécurité, était au courant que ce genre d’alertes précoces permettaient aux États-Unis d’exploiter des failles dans les logiciels vendus aux gouvernements étrangers, selon deux fonctionnaires d’État. Microsoft ne demande pas et ne peut pas savoir comment le gouvernement utilise de tels tuyaux, ont dit les fonctionnaires, qui ne souhaitent pas que leur identité soit révélée au vu de la confidentialité du sujet.

Frank Shaw, un porte-parole de Microsoft, a fait savoir que ces divulgations se font en coopération avec d’autres agences, et sont conçues pour donner aux gouvernements « une longueur d’avance » sur l’évaluation des risques et des mitigations.

Réfléchissons-y donc un moment.

Des entreprises et des gouvernements achètent des logiciels à Microsoft, se reposant sur la compagnie pour créer des programmes qui sont sûrs et sans risque. Aucun logiciel n’est complètement exempt de bogues, et des failles sérieuses sont trouvées régulièrement dans le code de Microsoft (et dans l’open source, aussi, bien sûr). Donc le problème n’est pas de savoir si les logiciels ont des failles, tout bout de code non-trivial en a, mais de savoir comment les auteurs du code réagissent.

Ce que veulent les gouvernements et les compagnies, c’est que ces failles soient corrigées le plus vite possible, de manière à ce qu’elles ne puissent pas être exploitées par des criminels pour causer des dégâts sur leurs systèmes. Et pourtant, nous apprenons maintenant que l’une des premières choses que fait Microsoft, c’est d’envoyer des informations au sujet de ces failles à de multiples agences, en incluant sans doute la NSA et la CIA. En outre, nous savons aussi que « ce type d’alerte précoce a permis aux U.S.A. d’exploiter des failles dans les logiciels vendus aux gouvernements étrangers »

Et rappelez-vous que « gouvernements étrangers » signifie ceux des pays européens aussi bien que les autres (le fait que le gouvernement du Royaume-Uni ait espionné des pays « alliés » souligne que tout le monde le fait). Il serait également naïf de penser que les agences de renseignement américaines exploitent ces failles « jour 0 » seulement pour pénétrer dans les systèmes des gouvernements ; l’espionnage industriel représentait une partie de l’ancien programme de surveillance Echelon, et il n’y a aucune raison de penser que les U.S.A. vont se limiter aujourd’hui (s’il y a eu un changement, les choses ont empiré).

Il est donc fortement probable que les faiblesses des produits Microsoft soient régulièrement utilisées pour s’infiltrer et pratiquer toutes sortes d’espionnage dans les gouvernements et sociétés étrangères. Ainsi, chaque fois qu’une entreprise installe un nouveau correctif d’une faille majeure provenant de Microsoft, il faut garder à l’esprit que quelqu’un a pu avoir utilisé cette faiblesse à des fins malveillantes.

Les conséquences de cette situation sont très profondes. Les entreprises achètent des produits Microsoft pour plusieurs raisons, mais toutes supposent que la compagnie fait de son mieux pour les protéger. Les dernières révélations montrent que c’est une hypothèse fausse : Microsoft transmet consciencieusement et régulièrement des informations sur la manière de percer les sécurités de ses produits aux agences américaines. Ce qui arrive à ces informations plus tard est, évidemment, un secret. Pas à cause du « terrorisme », mais parce qu’il est presque certain que des attaques illégales sont menées contre d’autres pays (et leurs entreprises) en dehors des États-Unis.

Ce n’est rien d’autre qu’une trahison de la confiance que les utilisateurs placent en Microsoft, et je me demande comment un responsable informatique peut encore sérieusement recommander l’utilisation de produits Microsoft maintenant que nous sommes presque sûrs qu’ils sont un vecteur d’attaques par les agences d’espionnage américaines qui peuvent potentiellement causer d’énormes pertes aux entreprises concernées (comme ce qui est arrivé avec Echelon).

Mais il y a un autre angle intéressant. Même si peu de choses ont été écrites à ce sujet — même par moi, à ma grande honte — un nouvel accord législatif portant sur les attaques en ligne est en cours d’élaboration par l’Union Européenne. Voici un aspect de cet accord :

Ce texte demandera aux États membres de fixer leur peine maximale d’emprisonnement à au moins deux ans pour les crimes suivants : accéder à ou interférer illégalement avec des systèmes d’informations, interférer illégalement avec les données, intercepter illégalement des communications ou produire et vendre intentionnellement des outils utilisés pour commettre ces infractions.

« Accéder ou interférer illégalement avec des systèmes d’informations » semble être précisément ce que le gouvernement des États-Unis fait aux systèmes étrangers, dont probablement ceux de l’Union Européenne. Donc, cela indiquerait que le gouvernement américain va tomber sous le coup de ces nouvelles réglementations. Mais peut-être que Microsoft aussi, car c’est lui qui en premier lieu a rendu possible l’« accès illégal ».

Et il y a un autre aspect. Supposons que les espions américains utilisent des failles dans les logiciels de Microsoft pour entrer dans un réseau d’entreprise et y espionner des tiers. Je me demande si ces entreprises peuvent elles-mêmes se trouver accusées de toute sorte d’infractions dont elles ne savaient rien ; et finir au tribunal. Prouver son innocence ici risque d’être difficile, car en ce cas les réseaux d’entreprise seraient effectivement utilisés pour espionner.

Au final, ce risque est encore une autre bonne raison de ne jamais utiliser des logiciels de Microsoft, avec toutes les autres qui ont été écrites ici ces dernières années. Ce n’est pas uniquement que l’open source est généralement moins cher (particulièrement si vous prenez en considération le prix de l’enfermement livré avec les logiciels Microsoft), mieux écrit, plus rapide, plus sûr et plus sécurisé. Mais par-dessus tout, le logiciel libre respecte ses utilisateurs, les plaçant solidement aux commandes.

Cela vous ôte toute crainte que l’entreprise vous ayant fourni un programme donne en secret à des tiers la possibilité de retourner contre vous ce logiciel que vous avez payé assez cher. Après tout, la plupart des résolutions des bogues dans l’open source est effectuée par des codeurs qui ont un peu d’amour pour l’autorité verticale, de sorte que la probabilité qu’ils donnent régulièrement les failles à la NSA, comme le fait Microsoft, doit être extrêmement faible.

Crédit photo : Cambodia4kidsorg (Creative Commons By)

24 Jun 10:12

Quand le journal Le Monde fait du (très) mauvais journalisme

by obouba

Je viens de tomber sur cet article du Monde, consécutif à un appel à témoignage sur le thème « Bac+5, vous occupez un emploi inférieur à votre niveau de diplôme ». Une cinquantaine de personnes ont répondu. L’article est titré « Quand on est caissière avec un bac+5, on apprend l’humilité! »

Je trouve la démarche affligeante. Elle laisse penser que les études ne servent à rien, puisqu’on finit caissière ou vendeur de sushis. C’est ce que disent explicitement certaines personnes ayant témoignées. Ainsi que des commentateurs de l’article.

Un bon journaliste aurait pris soin, en début d’article, de donner quelques chiffres sur les taux de chômage, les niveaux de salaires et le type d’emploi occupé par les bacs+5, relativement aux personnes ayant arrêté plus tôt leurs études. C’est difficile à trouver, allez-vous peut-être me dire?

Pas du tout : le Cereq interroge régulièrement un échantillon représentatif des sortants du système éducatif, trois ans après l’obtention de leur dernier diplôme. La dernière génération enquêtée est la génération 2007, enquêtée en 2010 (la génération 2010 est actuellement enquêtée, résultats en 2014). Beaucoup de résultats sont disponibles ici, ça m’a pris 30 secondes pour trouver le tableau que je voulais :

cereq

9% de chômage chez les bac+5 contre 18% en moyenne pour l’ensemble des sortants. 79% en CDI contre 60% en moyenne. 94% sont cadres ou profession intermédiaire contre 52% en moyenne. Salaire médian net mensuel de 2000€, contre 1380€ en moyenne. Je vous laisse découvrir les chiffres pour tous les niveaux de diplôme.

C’était si compliqué de le dire? Rien n’empêche ensuite d’interroger des personnes atypiques, mais ce rappel introductif aurait tout changé. Sans ce rappel, cet article, c’est du grand n’importe quoi.

23 Jun 21:30

Enseignants-chercheurs : pourquoi il ne faut pas (nécessairement) recruter les candidats des meilleurs labos…

by obouba

Article passionnant de John P. Conley and Ali Sina Onder trouvé via Freakonometrics.

Je vous explique la problématique : supposons qu’une faculté d’économie de province, au hasard Poitiers, doive recruter un maître de conférences. Des candidats issus de différentes facultés françaises vont postuler, certains issus des sites considérés comme les plus performants (disons Toulouse School of Economics (TSE) et Paris School of Economics (PSE) en France), d’autres de sites considérés comme moins performants. Vaut-il mieux recruter un candidat de « milieu de tableau » de PSE ou TSE, ou bien un candidat de « haut de tableau » d’un site moins performant? On pourrait supposer qu’un candidat de « milieu de tableau » de TSE ou PSE est préférable : ces sites sont très attractifs, ils attirent les meilleurs candidats en thèse, même les moyens doivent être très bons, meilleurs que les bons des universités moyennes, en tout cas. De plus, les formations qu’ils dispensent et l’encadrement doctoral assuré par les directeurs de thèse, eux-mêmes considérés comme étant les plus performants, doivent permettre de « produire » les meilleurs docteurs et les futurs meilleurs chercheurs.

C’est précisément ce type de problématique qui est traité dans l’article cité, qui s’appuie sur des données américaines. Les auteurs ont collecté des informations sur la productivité des docteurs, six ans après leur recrutement comme Assistant Professor et ont regardé si ce qui comptait le plus, dans leur performance, était le site d’origine (departmental rank) ou leur rang dans leur département d’origine (class rank).

Résultats :

  • c’est le class rank qui est déterminant, il vaut donc mieux recruter un très bon d’un site moyen qu’un moyen d’un site très bon,
  • la performance des docteurs décroît très vite dans tous les sites, le docteur médian issu d’Harvard obtenant un score loin de lui permettre d’obtenir une tenure (d’être titularisé en quelque sorte) dans quelque département que ce soit,
  • tout ceci semble indiquer que les meilleurs sites ne font pas un très bon travail en terme de formation puisque seuls leurs meilleurs étudiants vont réussir à devenir de très bons chercheurs.

Bien sûr, il s’agit d’un travail sur données américaines, la transposition au cas français est sujette à caution. Mais pour avoir participé à pas mal de jury de recrutement en économie, je le trouve instructif. Il est arrivé assez souvent que des candidats issus de sites très réputés ne comprennent pas, mais alors absolument pas, comment il était possible qu’ils se soient fait « doubler » par des candidats issus de petites universités de province. J’ai eu écho, également, de normaliens ou de polytechniciens devenus docteurs ne comprenant pas plus comment il était possible qu’ils ne soient pas recrutés, au profit de candidats issus de simples facs.  Dans tous les cas, leur tendance naturelle les conduit à dénoncer des systèmes de recrutement nécessairement mauvais, qui ne le sont pas toujours…

23 Jun 12:47

Comment j’ai décoré Jean-Pierrre Léaud.

by serge toubiana

Cela n’arrive qu’une fois dans une vie et cela ne se refuse pas : décorer Jean-Pierre Léaud de la Légion d’Honneur. Cela s’est passé hier, entre amis, à la Cinémathèque française.

Mon cher Jean-Pierre,

Tu m’as demandé de te remettre la Légion d’honneur. J’ai accepté car c’est un privilège. C’est aussi un devoir que je vais m’efforcer de remplir avec sympathie et amitié.

Cette décoration signifie pour toi quelque chose d’important, tu ne te sens pas au-dessus, tu l’acceptes dignement, avec fierté. Nous savons tous ici que tu la mérites amplement.

Le fait que ce rituel se déroule à la Cinémathèque, une maison que tu connais bien, que tu as fréquenté et pour laquelle tu t’es battu au moment où il fallait défendre Henri Langlois, a une signification particulière. Cette cinémathèque, lieu de mémoire et de vie où toutes les générations se sont croisées et se croisent encore, liées par l’amour du cinéma.

Tu as joué un rôle essentiel dans ma vie. Pas encore sorti de mon adolescence, tu étais mon héros à l’écran. Milieu des années 60, Grenoble : lycéen je découvre les films de Godard, Truffaut, Resnais, les premiers Bertolucci et Bellocchio. Pierrot le Fou, Masculin Féminin, Les Quatre Cents Coups, Baisers volés, La Chinoise, La guerre est finie, Prima della rivoluzione, Les Poings dans les poches, Le père Noël a les yeux bleus…Temps béni de l’innocence et des découvertes : ces films ont changé le cours de ma vie, ils m’ont pris la main et c’est par le biais des acteurs que je me suis identifié à un air du temps qui prônait l’insolence, la liberté, l’apprentissage de la vie, l’engagement militant. Une manière de parler et de bouger. Antoine Doinel m’a marqué comme il a marqué des centaines de milliers de jeunes gens dans le monde. Ce dur et délicat temps de l’adolescence, tu l’as incarné avec un talent et une vérité hors normes. Avec un mélange d’innocence et de ruse, un sens aigu de la vie, un don inouï pour émouvoir.

Tant d’énergie et de vaillance. Comment oublier ce que nous te devons ? L’apprentissage de la vie, l’éducation sentimentale, l’apprentissage de soi et des autres. Tu l’as incarné comme personne, à la manière de ces personnages de la littérature du XIXe chez Flaubert, Dickens, Balzac. Tu as été pour nous leur équivalent, une figure libre, unique, irremplaçable.

Derrière l’écran, il y avait bien sûr des cinéastes, des auteurs : Truffaut, Godard, Rivette, Eustache, Skolimowski, Garrel, qui chuchotaient à ton oreille leurs répliques, mais je l’ignorais alors. Sur l’écran il n’y avait que toi, l’acteur Jean-Pierre Léaud, alter ego idéal, grand frère libérateur. Tu donnais le sentiment de l’improvisation, comme si tu réinventais le jeu et le mime, la gestuelle du muet, avec une énergie incroyable et juvénile. Il y avait chez toi, il y a encore, une force incroyable qui refuse d’être adulte, une capacité inouïe d’irresponsabilité, de refus du monde réel au profit d’un monde poétique, burlesque : un monde en apesanteur. J’ai revu récemment Le Départ de Jerzy Skolimowski : tu bouges tout le temps, tu tombes, tu te relèves, et comme tout le film est post-synchronisé, cela crée un décalage physique qui fait penser à Buster Keaton. Ta voix également, qui ne ressemble à aucune autre : tu prends les mots, tu utilises la langue en la restituant selon un phrasé qui prend des vitesses différentes, tantôt calme et lent, tantôt intrépide et saccadé. C’est ta manière si personnelle de nous prendre de vitesse, d’exister par toi-même.

Cela ne s’invente pas, c’est inné. Cela ne se transmet pas, c’est en toi. Cela ne se dirige pas, tes metteurs en scène ont composé avec, ils ont eu le talent ou le génie de le voir en toi, dès ton adolescence.

Les bouts d’essai des 400 Coups : une pure merveille. Tu tiens tête à Truffaut, tu l’épates. Tu le séduis, dirait-on. Ça marche. Ensemble vous allez constituer un incroyable duo, durant trois décennies. Il t’a inventé acteur autant que tu l’inventes cinéaste. Lui, le méchant critique, l’homme le plus craint de tout le cinéma français, avait besoin d’adoucir les angles, de raconter son enfance qui ne fut pas drôle, en émouvant le spectateur. S’il y est parvenu c’est grâce à toi.

J’ai trouvé comme par miracle dans nos archives, grâce à Karine Mauduit, des documents rares et amusants.

Par exemple, la lettre que tu as écrite à Truffaut, après que celui-ci ait fait paraître une petite annonce dans France Soir, pour rechercher un jeune garçon qui serait le héros de son film :

« Monsieur, mon père vous a téléphoné samedi de la part de M. Domarchi. J’aimerais beaucoup tourner dans votre film. J’espère que vous me convoquerez pour me voir et me faire faire un bout d’essai. A bientôt, mes amitiés, JP Léaud.

Tu passes un bout d’essai au cours duquel tu dis à Truffaut : « Il paraît que vous cherchez un mec qui soit gouailleur, alors je suis venu. »

J’ai aussi retrouvé cette note de Truffaut qui rend compte de cette première audition. Il écrit à ton propos :

Très beau, un peu féminin

Fils de Jacqueline Pierreux et Pierre Léaud

Il connaît Domarchi ? (Domarchi était un critique des Cahiers du cinéma)

Sa lettre est bien écrite, simple, nette.

Et ce mot rajouté à la main : intelligent.

Enfin : Antoine ou René (l’autre personnage du film) et Truffaut a biffé René au stylo. Tu seras donc Antoine.

Truffaut écrit à ton père, Pierre Léaud, le 20 octobre pour lui dire :

« Je suis bien décidé à confier un rôle important des 400 Coups à votre fils Jean-Pierre, sans savoir lequel encore. Je désire lui faire passer plusieurs scènes du film cette fois sans caméra le : jeudi 23 octobre 1958 à 15 heures à mon domicile.

Votre fils Jean-Pierre m’a semblé très intelligent et assez précoce pour que les quelques semaines pendant lesquelles nous lui ferons manquer la classe, ne constituent pas un handicap insurmontable pour sa scolarité. Avec mes remerciements, veuillez agréer, Monsieur, l’assurance de mes sentiments distingués. François Truffaut. »

Truffaut ne s’est trompé que sur un point : tes débuts fracassants au cinéma ont créé un handicap insurmontable pour ta scolarité. Après l’accueil triomphal du film à Cannes en mai 59, toi porté sur les épaules sur les marches du palais, adoubé par Jean Cocteau, comment pouvais-tu revenir à une vie normale et retourner à Pontigny (Yonne) pour y redevenir écolier ?

A Cannes, la presse louangeuse te porte aux nues. Dans un entretien publié dans un grand quotidien tu déclares : « Je ne veux pas ressembler à Gabin… il est bourré de tics… » Un peu prétentieux, notre jeune ami !

Tu es né au cinéma de cette rencontre avec Truffaut. Avec ce nom d’emprunt : Antoine Doinel, qui faillit d’ailleurs s’appeler Antoine Loinod. Pendant tout le tournage des 400 Coups, Loinod est le nom de famille d’Antoine. Loinod : l’anagramme de Doniol, alias Jacques Doniol-Valcroze, rédacteur en chef des Cahiers du cinéma, ami d’André Bazin, et cinéaste. Un homme courtois, charmant, plein d’ironie, que j’ai beaucoup aimé. Loinod se transforme en Doinel, le nom de la secrétaire de Jean Renoir.

Antoine Doinel, Antoine Doinel, Antoine Doinel, répètes-tu devant la glace dans Baisers volés. C’est mieux que : Antoine Loinod, Antoine Loinod, Antoine Loinod. Identité double, la tienne et celle de l’auteur : il y avait de la place pour deux dans ce personnage.

Naître au cinéma, y trouver sa place, y construire sa vie, avec des hauts et des bas. C’est toute ta vie, mon cher Jean-Pierre. Truffaut t’a filmé à 13 ans et demi, à dix-neuf ans, à vingt-quatre ans, à vingt-huit ans et à trente trois. La saga Doinel. Sans compter deux autres films qui ont beaucoup compté : Les Deux Anglaises et le Continent et La Nuit américaine. L’histoire d’une vie, celle d’un jeune homme pressé de vivre et qui se projette en avant – je paraphrase Truffaut en disant cela.

Durant ces belles années 60, tu passes d’un film de Truffaut à un film de Godard. Monnaie d’échange, tu deviens le trait d’union entre ces deux anciens amis. Et bien plus que cela. Tu es leur médium, tu les inspires : d’un côté le romantisme truffaldien, de l’autre la théâtralité, la déclamation, le montage historique, la joute verbale, l’imprécation politique, côté Godard : de Masculin Féminin au Gai savoir.

Au début des années 70, tu es dans deux films qui sont pour moi parmi les plus beaux du cinéma français : Les Deux Anglaises et La Maman et la Putain. Le romantisme toujours, le personnage de Claude Roc qui hésite entre deux femmes, entre deux sœurs, autour de ce thème de la fièvre amoureuse qui est au cœur du cinéma de Truffaut. Alexandre dans La Maman et la Putain, lui aussi pris entre deux femmes, Veronika et Marie. Le romantisme toujours, celui d’Eustache plongeant dans les eaux troubles du langage, film manifeste d’une époque qui marque le début du refoulement de ce qu’on appelait la « libération des mœurs ». Film inoubliable.

J’ai lu un entretien récent – tu n’en donnes pas souvent, j’ai même essuyé plusieurs refus de ta part, chaque fois que je t’ai sollicité pour parler –un entretien où tu disais : « Je suis complètement différent dans la vie et au cinéma. Quand je tourne, je suis là. J’ai ma musique. J’ai mon texte. Il y a la caméra. Il n’y a plus qu’un seul moment : celui où je m’inscris avec mon corps dans le jeu, pour créer le personnage. Dans la vie : il n’y a pas tout ça. Donc je ne crée pas un personnage dans la vie de tous les jours. J’ai mon costume, ma cravate, mais il ne se passe rien. La vie n’existe que quand je tourne. Voilà le paradoxe. » C’est dans So Film.

Tu es très précis quand tu parles de ton approche du métier d’acteur, des mots simples et justes qui viennent de ta longue expérience et de ton intelligence d’acteur. Tu dis encore ceci : « Je suis un bûcheur ! J’arrive avec mes repères, j’ai le texte. À ce moment-là, je suis, je lis, je dis, j’existe. Mais il faut la caméra. Dans la vie, il n’y a pas de caméra et je deviens ennuyeux. La caméra, c’est mon point de repères. »

Si on a compris cela, on a tout compris du cinéma ou presque. Tu vas à l’essentiel, et cela n’a rien à voir avec la fameuse « Méthode », celle de ces acteurs qui s’enferment dans leur personnage à double tour. Toi tu laisses venir l’énergie, tu travailles beaucoup en amont, de manière invisible, pour être en situation, tu satures ton texte et ton personnage, pour être libre au moment de la scène ou de la prise. Et tu es un acteur physique, tu joues avec ton corps, ton corps joue pour toi, il exprime, prend des risques, il danse, tombe et se relève ; il bute sur le monde réel, il en bouscule l’ordonnance, il lui propose un nouvel équilibre. Le corps et le langage vont de pair : tu es un acteur magique. Halluciné, disait François Truffaut. Jouer c’est jaillir à l’intérieur de soi-même. C’est faire irruption dans le monde du rêve.

Tu m’as dit l’autre jour que tu avais traversé un moment difficile, une mauvaise passe dans la vie, qui t’avait fait douter de ton talent et de ton métier. C’était au moment de la maladie de François. Tu as alors fait signe à Godard, que tu n’avais pas vu depuis des années. Un an plus tard il te proposait un rôle dans Détective, aux côtés de Johnny Hallyday, Nathalie Baye, Alain Cuny, Claude Brasseur.

Dans un court texte, Godard dit ceci :

« Tu as l’embarras du choix. Tu peux continuer là où Georges Flamant s’est arrêté. Tu peux aller plus loin que là où Robert Mitchum n’est pas encore arrivé. Tu dois aller jusqu’au jour où un autre Vigo en pleine santé aura besoin d’un nouveau père Jules que le fantôme de Michel Simon viendra protéger. L’avis – la vie de François, la mienne, on te la doit. Tu te la dois aussi maintenant. Aussi grand sois-tu quand tu traverses le hall de l’hôtel en pleurant des larmes plus grandes que ton immense imper volé à la légende de Jesse James, tu ne mérites dans ce cas que zéro de conduite. Il te reste, il nous reste d’autres films à faire. Avec les trois millions de supplément que tu as bien gagné, loue une salle, appelle-la cours Jean Eustache si tu y tiens – il y tiendrait, demande à Garrel, à Duras, à moi, et à d’autres, de venir dire pourquoi et comment encore le cinéma. »

Le temps passe, quelque chose de l’enfance demeure. Aujourd’hui, quand je te vois, quand nous parlons ensemble, lorsque tu passes à l’improviste me voir à la Cinémathèque, comme tu le faisais du temps où j’étais aux Cahiers, je me dis qu’il y a quelque chose d’incroyable qui survit grâce à toi : en dépit de ce que tu as vécu et traversé, la gloire dès la jeunesse, ton nom indissociablement associé à la Nouvelle Vague et inscrit dans l’Histoire du cinéma, tu demeures humble et fier, pauvre comme Job. Tu ne t’es pas embourgeoisé, tu n’es devenu ni une statue ni un monument historique, tu demeures un être fragile et solitaire, disponible pour vivre d’autres aventures au cinéma. Olivier Assayas, Serge Le Péron, Josiane Balasko, Noémie Lvovsky, Aki Kaurismäki, Bertrand Bonello, Tsai Ming liang, Danièle Dubroux, Lucas Belvaux et d’autres, ont reconnu en toi cette chose si précieuse. Pour eux tu fais lien avec Cocteau, avec Truffaut et Eustache, avec Godard, acteur médium qui permet de lire le monde sur son versant poétique. Cette qualité là est en toi, pure, intacte.

Mon cher Jean-Pierre, je sais qu’en accrochant cette médaille sur le revers de ton costume, je n’alourdirai en rien cette liberté qui est en toi ni cette jeunesse.

Aussi, au nom du Président de la République et en vertu des pouvoirs qui nous sont conférés, nous vous faisons Chevalier de la Légion d’Honneur.

23 Jun 12:28

Quand des partis pirates invitent l'Europe à réagir à l'affaire PRISM

by aKa

Nous avons participé à la traduction d’un article co-signé par un certain nombre de partis pirates européens qui intime l’Europe à ne pas rester passive face à ce qu’il vient de se produire du côté de la NSA…

Anti PRISM

Anti PRISM

URL d’origine du document

(Traduction : Lgodard, Yoann, kenoris, zer0chain, AmarOk, Asta + anonymes)

Nous sommes consternés de découvrir une surveillance sans précédent des utilisateurs d’Internet de par le monde via PRISM et les programmes du même ordre. Des capacités de surveillance globale de telles sortes — tout particulièrement lorsqu’elles sont mises en œuvre sans accord des citoyens — sont une atteinte sérieuse aux Droits de l’Homme, à la liberté d’expression ainsi qu’à la vie privée, tous trois éléments fondateurs de nos démocraties.

Nous applaudissons Edward Snowden pour ses actions de dénonciation. Quand un gouvernement est réellement par le peuple et pour le peuple, on ne peut considérer comme un crime de diffuser des informations sur le but et l’étendue des actions que le gouvernement engage au nom de ces citoyens, dans le but revendiqué de les protéger. Un gouvernement représentatif dans une démocratie repose sur le consentement de son peuple. Cependant, un tel consentement ne peut exister lorsque les citoyens ne sont pas complètement informés.

Nous notons avec inquiétude l’absence totale de considération que le gouvernement américain montre pour les droits des citoyens européens et, plus généralement, à toute personne qui utilise les services de communication et infrastructures américains. Nous notons également l’effet négatif sur ses alliés, la souveraineté des pays concernés et la compétitivité de leurs entreprises.

L’Europe se doit de répondre à ces révélations avec la détermination nécessaire. À la lumière de ces informations, il devient nécessaire pour l’Union Européenne de ne pas rester complice de ces abus de pouvoir aux lourdes répercussions, et de s’élever au rang de pionner dans les domaines des droits numériques, de la protection de la vie privée, de la transparence gouvernementale et de la protection des lanceurs d’alertes.

Nous demandons :

1. Asile et Protection aux lanceurs d’alertes

Le gouvernement des USA a démontré - dans le cas de Bradley Manning et d’autres - que son traitement des lanceurs d’alertes est une cause de préoccupation grave. L’étiquetage public d’Edward Snowden qui apparaît comme un “traître” pour les différents responsables et les médias a créé un climat dans lequel il ne peut avoir droit à procès équitable. Il pourrait être le sujet de persécutions pour sa politique de gouvernement transparent, et sera certainement en danger de recevoir des peines ou des traitements inhumains ou dégradants, y compris la menace de la peine de mort.

Nous demandons à tous les gouvernements d’Europe de traiter avec bienveillance les demandes d’asile politique ou le statut de protection subsidiaires de M. Edward Snowden et d’autres lanceurs d’alertes, en faisant avancer rapidement d’éventuelles demandes de ce type.

2. Découvrir les faits

Il est inacceptable que des programmes secrets de surveillance contournent toute procédure démocratique et empêchent l’engagement critique et rationnel nécessaire à une démocratie pour déterminer si une action est justifiée ou non.

Nous appelons le Parlement Européen à constituer un comité d’investigation, en accord avec l’article 185 de ses règles de procédure. Les faits à établir et publier sont :

  • Quelles sont les véritables capacités de PRISM ?
  • Quels sont les flux de données et les sources qu’il utilise ?
  • Quels corps administratifs de l’UE et ses états membres ont eu connaissance ou accès à PRISM et aux programmes similaires, ou à des données issues de ces derniers ?
  • À quel point la Charte des Droits Fondamentaux, la Directive 95/46/CE sur la protection des données personnelles, la Directive du 12 juillet 2002 sur la protection de la vie privée dans le secteur des communications électroniques, ou d’autres lois européennes ont-elles été violées ?

Nous adressons cet appel à tous les parlements nationaux - afin de déterminer si les constitutions nationales, les lois de protection des données et les lois d’espionnage ont été violées.

3. Forte protection des données européennes

La proposition de loi General Data Protection Regulation en cours d’examen doit être renforcé afin d’assurer une protection plus large et plus profonde des données privées et professionnelles. Aux efforts de lobbying opposés il faut résister.

En particulier, les données des citoyens européens ne doivent pas être sciemment remises aux services d’espionnage des États-Unis d’Amérique. L’article 42 issu de la première fuite de proposition de loi, qui portait sur les mesures de protection des lois extra territoriales de pays tiers comme le Patriot Act ou encore le Foreign Intelligence Surveillance Act des USA en posant des barrières aux autorités étrangères lors de l’accès aux données européennes, doit être réintroduit. Les méta données ainsi que les pseudonymes doivent également être protégés.

D’après les principes de la “Sphère de sécurité” relatifs à la protection de la vie privée, les entreprises américaines doivent informer leurs clients lorsqu’elles permettent à des tiers d’accéder à leurs données. Il semble que les entreprises associées au programme PRISM ont violé ces dispositions. En conséquence, l’UE doit révoquer son accord à ces principes (décision n°2000/520/EC de la Commission), de telle sorte que les entreprises concernées soient soumises à la justice européenne si elles ne cessent pas ces pratiques immédiatement. La “Sphère de sécurité” doit soit être renégociée en intégrant des mesures de protection plus efficaces et plus de moyens de recours, soit être remplacée par un nouvel accord international sur la protection des données, par exemple basé sur la proposition de loi “General Data Protection Regulation”.

4. Traité international sur la Liberté sur Internet

Pour assurer qu’Internet reste une force d’autonomisation et de démocratisation plutôt que continuer d’être utilisé comme un outil limitant et réduisant la démocratie et la liberté individuelle, l’Union Européenne devrait être le fer de lance d’un traité international sur la Liberté sur Internet. Un tel traité devrait protéger fortement la confidentialité des communications, la liberté d’expression et l’accès à l’information (en particulier ce qui touche à l’Internet) ainsi que la neutralité du net.

5. Financement de logiciels respectueux de la vie privée

Afin de constituer une nouvelle ligne de défense de la vie privée, les utilisateurs doivent pouvoir choisir des logiciels et services qui respectent vraiment leur vie privée. De tels logiciels devraient garantir l’anonymat de leurs utilisateurs, offrir un système fort de chiffrement de bout-en-bout, des architectures pair-à-pair, la possibilté d’héberger soi-même ses données, un code source visible de tous, etc.

Nous nous réjouissons de voir que « protéger la vie privée et la liberté des internautes » fait partie des propositions soumises en ce moment au programme Horizon 2020. Nous demandons à l’Union Européenne, d’une part d’allouer une part bien plus significative des fonds de recherche à la diversification de l’offre logicielle qu’aux projets ayant le but contraire, par exemple le développement des outils de surveillance et d’exploration des données, et d’autre part de rejeter fermement des propositions dont le but explicite est la surveillance généralisée ne se basant sur aucune suspicion fondée.

6. Prévention contre un PRISM européen

Nous proposons des moyens législatifs visant à renforcer la défense contre les organismes similaires à travers toute l’Europe.

Les écoutes directes des agences gouvernementales des communications au cœur du réseau Internet — comme celles ayant été reportées comme installées par la NSA dans le cadre du programme BLARNEY — doivent être explicitement déclarées hors-la-loi. De telles écoutes autorisent le stockage et l’analyse de données de toutes les communications ayant lieu sur Internet, outrepassant toutes les procédures et contrôles existants, mettant ainsi en péril la confidentialité de toutes données et la vie privée de chacun. Porter atteinte à l’intégrité du réseau d’une manière aussi révoltante empêche tout un chacun de lui faire confiance, et nous prive de tous les points positifs que l’on peut y trouver.

Nous renouvelons donc notre appel pour la révocation de la directive sur la conservation des données. Les juridictions constitutionnelles tchèque, serbe et roumaine ont explicitement conclu que la collecte à grande échelle et sans suspicions de données personnelles est une violation fondamentale des droits de l’homme. Par la collecte généralisée de grandes quantités de données sans l’accord d’un tribunal, les programmes de conservation de données permettent au pouvoir exécutif d’outrepasser ses attributions au travers de plate-formes telles que PRISM, menaçant du même coup la séparation des pouvoirs exécutif et judiciaire, qui est le fondement de nos démocraties.

21 Jun 16:42

Le « Marché de l’Art pour les nuls » doublement primé aux Data Journalism Awards

by JeanAbbiateci

Alors, ça pour une bonne nouvelle… !

Je suis très heureux (et plutôt fier) de vous annoncer que mon application « le Marché de l’art pour les nuls » (réalisée avec l’aide d’Ask Média pour la traduction et les textes) a décroché deux Data Journalism Awards hier soir. Cette compétition mondiale organisée par le Global Editors Network récompense les meilleurs projets de journalisme de données.

Donc, deux prix dans la musette hier soir :

- Le premier pour « Le choix du public » (et un très grand merci à tous ceux qui ont voté et partagé sur les réseaux sociaux).

- L’autre, le plus prestigieux, décerné par le jury dans la catégorie « Data Driven Storytelling, small media ». Très honnêtement, c’est quand même celui-ci qui fait le plus plaisir, au vu notamment de la composition du jury (Paul Steiger de Propublica, Simon Rogers, ex-taulier du Datablog du Guardian,…) et de la qualité des projets nominés dans ma catégorie (la BBC, Propublica….).

Le palmarès complet de ces Data Journalim Awards est disponible ici (avec des trucs vraiment cool, notamment le boulot de la Nacion).

Si on m’avait il y a dix ans, quand j’ai commencé ma carrière comme reporter dans un petit hebdomadaire agricole de la Loire qu’un jour, je trouverais passionnant de bricoler du code et bidouiller des données dans un tableur… Jamais je n’ai trouvé mon métier de journaliste aussi intéressant !

PS : Mes confrères de We Do Data ont aussi décroché un prix aussi pour leur Pariteur, celui de la meilleure application. Bravo à eux.

Crédit photo : Arnaud Merci sur Twitter

20 Jun 13:28

L’administration pénitentiaire manque de transparence

by datablog

(Article mis à jour le 30 juillet 2013)

En novembre 2012, nous réalisions une carte présentant la population écrouée pour souligner le problème de surpopulation dans certains établissements pénitentiaires. A mesure que les mois se suivent, les records se suivent. Alors que les syndicats des surveillants de prison appellent à la grève, nous souhaitons remettre à jour la carte.

Hélas, les données disponibles sur le site du ministère de la justice – et sur data.gouv.fr – ne contiennent pas le détail par prison dans la version de juin. Contacté, le service de presse des services pénitentiaires reconnaît l'erreur et... supprime le document publié en novembre, pour le remplacer par un document "allégé". Ces chiffres détaillés ne sont pas destinés à être publiés. "Les chiffres évoluent régulièrement. Les données publiées ne seraient qu'une photo à un instant 't'" explique le service de presse. Les données agrégées mises à disposition du public dans la version "allégée" ne précisant, sur les questions de densité, que les fourchettes.

Les chiffres pouvant être mal interprétés, mieux vaut donc ne pas du tout les publier. Le document mensuel est donc présenté sous deux formes. Celles contenant le détail par établissement, réservé à un public particulier. Et celui ne contenant que des statistiques agrégées, à destination du grand public.

L'Observatoire international des prisons récupère de son côté le fichier complet par la bande. Qui nous a permis donc de remettre à jour notre carte, avec les chiffres d'avril 2013. L'organisme ajoute que ce n'est pas le seul document contenant des informations "pourtant communiquables" qu'ils ont des difficultés à obtenir. L'organisme poursuit : "C'est le reproche que l'on fait régulièrement à l'administration : leur manque de transparence."

Alors que l'open-data est une ambition affichée du gouvernement, certaines administrations n'y plongent pas la tête la première. Nous allons saisir la commission d'accès aux documents administratifs (CADA) pour avoir accès à ces données, comme cela a déjà été fait récemment pour des données de Pôle Emploi.

Mise à jour (30 juillet 2013) : La CADA a rendu le 25 juillet un avis "favorable" à la demande de communication des données. "La commission estime que ces documents administratifs, s'ils existent ou peuvent être obtenus par un traitement d'usage courant, sont communicables à toute personne qui en fait la demande, en application de l'article 2 de la loi du 17 juillet 1978." Ayant informé le ministère de la justice de cet avis, nous attendons désormais qu'ils transmettent ces informations.

Lire aussi : "Le culte du secret reste fort dans l'administration" et sur Rue89 : "Administration muette ? Fais comme les journalistes, saisis la Cada"

Alexandre Léchenet

20 Jun 08:41

Les ravages d’une source mal choisie ?

by RM
Pachevalier

Très drôle

Aujourd’hui sur Twitter, le journaliste et romancier Pierre Assouline a écrit :

M. Assouline n’avait pas parlé de Wikipédia depuis plusieurs années et il est réconfortant de voir que le projet lui tient toujours à coeur.

Sur le fond, cependant, cette dénonciation est étonnante. Je ne suis pas journaliste mais il me semblait que le travail consistait précisément à recueillir des sources, choisir les plus intéressantes et en tirer un texte qui les mette en oeuvre afin d’informer les lecteurs. Dès lors, il est difficile de comprendre comment une source peut provoquer de tels ravages. Sauf si on part du principe que les journalistes recopient sans vérifier, sans comprendre, sans connaître leur sujet… mais ce serait alors une rude charge de la part de M. Assouline envers ses collègues.

D’autant que Wikipédia – et certains le dénoncent pour cette raison – est souvent plus visible et en tout cas plus lu que les journaux : ce serait une drôle d’idée de copier-coller une ressource gratuite et visible sans apporter de valeur ajoutée et vendre le résultat.

Mais encore ceci vaudrait-il si les contributeurs de Wikipédia avaient été pris en défaut. Or, que lisait-on alors dans l’article Maurice Nadeau à cette date ?

Nadeau

Les noms avancés sont donc ceux de personnes éditées par Nadeau ou d’auteurs dont Nadeau a contribué à la découverte en France (et non de la seule découverte comme avancé dans le tweet suscité).

Il n’y a toutefois pas de sources à ce passage de l’article, ce qui est *mal*.

Dès lors, plus qu’une chose à faire : vérifier. C’est apparemment les noms de Beckett et de Soljénitsyne qui ont choqué M. Assouline : il s’agissait donc de savoir quelles ont été les relations de Maurice Nadeau avec ces deux auteurs.

Pierre Maury, qui a connu Maurice Nadeau, écrit (dans un billet de blog qui laisse à penser qu’il a lui-même lu un peu trop rapidement ledit article de Wikipédia, d’ailleurs) :

Cela ne l’a [Nadeau] pas empêché, très vite, d’écrire des articles sur le futur prix Nobel de littérature, de se rapprocher de lui, de publier de nombreux textes inédits dans Les Lettres nouvelles, et de lui donner plus d’une page, pour un autre inédit, dans le premier numéro de La Quinzaine littéraire.

Maurice Nadeau a donc bien édité Beckett.

Qu’en est-il de Soljénitsyne ? Nous nous sommes posé la question tous ensemble sur Twitter, pendant l’heure de midi :

Bibo el Mago a donné des éléments de réponse précis, sur le rôle de Nadeau dans la promotion de l’écrivain soviétique en France :

Sauf erreur, l’information était donc elle aussi pertinente : Nadeau a été un des premiers à faire connaître et reconnaître l’oeuvre de Soljénitsyne en France. Les erreurs sont néanmoins toujours possibles et personne ne doute que M. Assouline soit un bon connaisseur de la vie littéraire du XXe siècle : il était donc important qu’il pût répondre, afin que la critique ne soit pas stérile mais aboutisse à une meilleure information sur le travail de Maurice Nadeau.

Hélas, à cette heure, M. Assouline n’a pas répondu. Nous ignorons donc pour l’instant quels éléments lui semblaient erronés et valaient de parler de « ravage ».

Mais son tweet, lui, a été lu par plusieurs dizaines de milliers de personnes – qui ont pu prendre pour argent comptant une attaque virulente, dont la pertinence nous échappe encore. Ce qui rappelle encore une fois la nécessité de lire de manière précise, de critiquer ses sources et de savoir en vérifier la pertinence.

19 Jun 04:39

Wikidata, le Wikipédia que vous utiliserez bientôt tous

by Pierre-Carl Langlais

Personne, ou presque, ne connaît Wikidata. Ce nouveau projet de la Wikimedia Foundation a été à peine mentionné dans la presse francophone. Et pourtant, vous allez l’utiliser au quotidien dans quelques années.

Comme son nom l’indique, Wikidata est un Wikipédia des données. Il vise à structurer les connaissances encyclopédiques en les inscrivant dans des relations sémantiques prédéfinies : les propriétés. La communauté internationale de Wikidata a ainsi créé plusieurs centaines de propriétés qui vont de « genre artistique » à « lieu de naissance ».

Même si,...

18 Jun 13:11

Non-statistician analysts are the new norm

by Nathan Yau

As data grows cheaper and more easily accessible, the people who analyze it aren't always statisticians. They're likely to not even have had any statistical training. Biostatistics professor Jeff Leek says we need to adapt to this broader audience.

What does this mean for statistics as a discipline? Well it is great news in that we have a lot more people to train. It also really drives home the importance of statistical literacy. But it also means we need to adapt our thinking about what it means to teach and perform statistics. We need to focus increasingly on interpretation and critique and away from formulas and memorization (think English composition versus grammar). We also need to realize that the most impactful statistical methods will not be used by statisticians, which means we need more fool proofing, more time automating, and more time creating software. The potential payout is huge for realizing that the tide has turned and most people who analyze data aren't statisticians.

Yep.

Those who disagree tend to worry what might happen — what kind of data-based decisions will be made — by non-statisticians, and that should definitely be a priority as we move forward. Non-statisticians often make incorrect assumptions about the data, forget about uncertainty, and don't know much about collection methodologies.

However, as a statistician (or someone who knows statistics), you can shoo everyone else away from the data and gripe when they come back, or you can help them get things right.

17 Jun 14:05

There's a map for that

by benbalter

Not long ago, we began rendering 3D models on GitHub. Today we're excited to announce the latest addition to the visualization family - geographic data. Any .geojson file in a GitHub repository will now be automatically rendered as an interactive, browsable map, annotated with your geodata.

screen shot 2013-06-13 at 10 23 32 am

People are already using GitHub to store everything from Chicago zipcodes to community radio stations to historic hurricane paths, and we can't wait to see what the community will begin to collaborate on next.

Under the hood we use Leaflet.js to render the geoJSON data, and overlay it on a custom version of MapBox's street view baselayer — simplified so that your data can really shine. Best of all, the base map uses OpenStreetMap data, so if you find an area to improve, edit away.

Maps on GitHub support rendering GIS data as points, lines, and polygons. You can even customize the way your data is displayed, such as coloring and sizing individual markers, specifying a more descriptive icon, or providing additional human-readable information to help identify the feature on click.

Looking to get started? Simply commit a .geojson file to a new or existing repository, or dive into the docs to learn how to customize the map's styling.

15 Jun 13:32

On the set of Adieu au langage

by cinemagodardcinema

Some insight from actor Daniel Ludwig: “Godard is not to be spoken to directly”. But he does anyway.


14 Jun 10:06

L’OKF France et Etalab vous invitent à redesigner data.gouv.fr !

by Samuel Goëta

etalab-fly-twitterLes citoyens et les designers prennent le pouvoir pour une soirée et aident à façonner leur portail de l’open data gouvernemental idéal.

En marge de la consultation publique sur la refonte de la plateforme d’ouverture des données data.gouv.fr, l’Open Knowledge Foundation France invite les graphistes et concepteurs  à un évènement de redesign dans les locaux d’Etalab pour élaborer visuellement et ergonomiquement la future version du portail.

Qu’est-ce qu’un redesign ? Cela consiste à élaborer, après avoir fait l’état des lieux de l’existant, une nouvelle interface pour un site ou un service. La nouvelle interface doit permettre de mieux répondre aux différents profils d’utilisateurs et leur proposer une expérience plus agréable et intuitive. Dans le cadre d’une démarche spontanée et indépendante, cela permet aussi en s’afranchissant des contraintes habituelles (de coûts, de délais, de prestataires…), de commencer à imaginer un outil idéal et à en dessiner les contours. Le jusqu’au boutisme est donc de mise, utopistes bienvenus.

Encadrée par des membres de l’Open Knowledge Foundation France et d’Etalab, la mission interministérielle en charge de l’ouverture des données publiques de l’Etat, la soirée vous permettra de mettre en commun vos influences et vos expériences, d’abord pour dresser un rapide tour d’horizon des portails d’open data gouvernementaux existants et faire ressortir les best-practices et enfin concevoir des premières recommandations graphiques et ergonomiques.

Des équipes seront constituées, composées de designers et de pratiquants de l’open-data. Elles peuvent d’ailleurs être constituées dés maintenant sur ce formulaire. En parallèle, les internautes pourront suivre l’évènement sur Twitter, mot-dièse #dataredesign.

Une mise en commun aura lieu en fin de soirée et un résumé ainsi que les productions (guidelines, draft, wireframes…) réalisées seront mises à disposition sur le site checkthis.com

Programme de l’événement
Jeudi 20 juin – de 19h à 23h dans les locaux d’Etalab à Paris

19h-20h – présentation des participants et réflexion en commun sur les plateforme d’open-data existantes, leurs fonctionnalités et leur ergonomie. Définition des objectifs pour les 2 heures suivantes et constitution des équipes si besoin.

20h-22h : Travail par équipe (définition de profils utilisateurs, de parcours utilisateurs, wireframes, UX, maquettes de homepage…)

22h-23h : mise en commun, récupération des éléments produits et discussion.

Profils des participants

  • Graphistes / Designers

  • Ergonomes / UX designers

  • Chefs de projet web

  • Utilisateurs chevronnés de plateforme open-data

  • Curieux et auto-didactes de l’open-data

  • Data-journalistes

Pour s’inscrire
dataredesign.eventbrite.fr

Attention, les places étant limitées nous insistons sur le fait que les inscrits s’engagent à venir (pour le bon fonctionnement de l’évènement et pour être productifs :) )

Licences des travaux produits dans la soirée : CC-BY-SA

Qui sommes-nous ?

A propos de l’Open Knowledge Foundation France

L’Open Knowlegde Foundation (OKFN) est une organisation à but non lucratif fondée en 2004 à Cambridge qui promeut la culture libre sous toutes ses formes. Ses membres considérent qu’un accès ouvert aux informations associé aux outils et aux communautés pour les utiliser sont des éléments essentiels pour améliorer notre gouvernance, notre recherche, notre économie et notre culture.

A propos d’Etalab

Au sein du Secrétariat général pour la modernisation de l’action publique, Etalab coordonne l’action des services de l’Etat et de ses établissements publics pour faciliter la réutilisation la plus large possible de leurs informations publiques.

Etalab administre le portail unique interministériel data.gouv.fr destiné à rassembler et à mettre à disposition librement l’ensemble des informations publiques de l’Etat, de ses établissements publics et, si elles le souhaitent, des collectivités territoriales et des personnes de droit public ou de droit privé chargées d’une mission de service public.

Etalab, depuis sa création, a mis en ligne le portail national data.gouv.fr qui permet l’accès à plus de 355 000 informations publiques gratuites et réutilisables. En rendant, par exemple, accessibles les dépenses du budget de l’Etat à partir d’un seul fichier brut dans un format réutilisable ou la liste des biens immobiliers propriété de l’Etat, data.gouv.fr contribue à rendre des comptes aux citoyens sur le fonctionnement de l’Etat et de ses administrations en permettant une plus grande transparence de leur fonctionnement.

Etalab a également rassemblé plus de 30 acteurs majeurs de l’innovation en France (grandes et petites entreprises, écoles d’ingénieurs, pôles de compétitivité, médias…) au sein d’une communauté appelée « Dataconnexions ». Dataconnexions encourage et soutient le développement de projets innovants de réutilisation de données publiques.

14 Jun 08:34

(VU SUR LE WEB) Vis ma vie de chat avec la BBC

by Marie Coussin

N’importe quel propriétaire de chat en a déjà rêvé, la BBC l’a fait : équiper dix chats de caméras GPS et les suivre à la trace, durant six jours pour cartographier leur parcours, recenser les data produites et enregistrer les vidéos de leurs plus grands moments. Rencontre avec un renard, bataille avec une machine à laver, combat avec un rival… Choisissez le chat qui vous intéresse et découvrez sa vie.

BBC

11 Jun 13:12

L'impôt sur le revenu ne finance que 15 % de l'État

by repasa

Le projet de loi de finance 2013 prévoit près de 500 milliards d’euros de recettes pour alimenter le « budget général » de l’État (selon l’article 118 de la loi de finances 2013). Il n’aura échappé à personne que le début du mois de mai marque le moment de remplir sa déclaration de revenus, l’occasion de faire une petite tournée d’où provient la majeure partie de ces centaines de milliards d’euros.

La TVA – l’impôt le plus inégalitaire – représente à elle seule plus de 40 % des recettes, là où l’impôt de solidarité sur la fortune ne remplit pas même 1 % des caisses avec ses quatre milliards (et l’impôt sur le revenu, tout juste 15 %).

Chacune des zones de cette infographie est proportionnelle aux recettes qu’elle apporte à l’État. Cliquez sur les rectangles rouges pour avoir le détail des recettes, et sur la barre du haut pour revenir à la vue générale.

Pour intégrer cette infographie sur votre site, copiez le code suivant :
<iframe frameborder="0" height="560px" width="700px" scrolling="no" src="http://data.passiondataviz.fr/recettes2013/"></iframe><a href="http://passiondataviz.fr/">Passion dataviz</a>
11 Jun 13:12

Primes des ministères : la répartition des ISP

by repasa

Ce sont les « indemnités de sujétion particulière » (ISP) dont la récente affaire des tableaux de Claude Guéant nous a fait reparler. Des indemnités qui remplacent depuis 2001 les « primes de cabinets » prélevées sur les « fonds spéciaux » en liquide, supprimées par le Premier ministre Lionel Jospin. Aujourd’hui, ces primes destinées aux ministres et à leurs collaborateurs (y compris les chauffeurs, cuistots, etc) sont publiques et fiscalisées. Elles atteignaient 25,9 millions d’euros en 2012, en baisse de 9 % par rapport à l’année 2011.

Des primes que Le Monde décide de corréler au nombre de collaborateurs (l’intégralité du travail de Samuel Laurent est disponible sur Google Doc). Retrouvez ici le détail de la répartition de ces primes en 2012.

Cliquez sur les bulles pour voir le détail des indemnités par ministère, puis sur la bulle de gauche pour revenir à la vue générale.

Source : lemonde.fr
Pour intégrer cette infographie sur votre site, copiez le code suivant :
<iframe frameborder="0" height="700px" width="700px" scrolling="no" src="http://data.passiondataviz.fr/isp/"></iframe><a href="http://passiondataviz.fr/">Passion dataviz</a>
11 Jun 13:12

Joueurs français à Roland-Garros : la quantité prime sur la qualité

by repasa

Non, les tennismen français ne sont pas si mauvais aux internationaux de France. Trente ans après la victoire de Yannick Noah, 25 après l’exploit de Henri Leconte (arrivé en finale face à Mats Wilander, avant de se faire démolir en trois sets), le bilan des joueurs hexagonaux est plutôt bon.

La France apparaît comme un pays plutôt stable en nombre de qualifiés en huitièmes de finale depuis 30 ans. Mais contrairement aux autres pays, elle peine à dépasser ce tour et se retrouve rapidement sans représentants. À l’inverse, depuis le début des années 90, l’Espagne envoie un grand nombre de joueurs dans le dernier carré. Cela sans compter l’hégémonie espagnole depuis 2000, dont le huitième titre de Rafael Nadal en neuf éditions est la preuve évidente.

L’occasion de comparer les performances sur la terre battue de la porte d’Auteuil des tennismen français avec ceux des quatre nations les plus titrées dans le tournoi messieurs depuis le début de l’ère Open : l’Espagne, la Suède, les États-Unis et l’ex-Tchécoslovaquie.

Chaque carré représente un tour à partir des huitièmes de finale. Plus il est foncé, plus le pays en question y a de représentants. Passez votre souris sur les carrés pour avoir le nombre exact.

Source : RG
10 Jun 08:12

Classification des communes françaises selon la présidentielle de 2012

by Juba

Je viens de mette en ligne un nouveau site : data.nozav.org. L'objectif est d'y publier des analyses ouvertes, dont le code source sera librement accessible, et basées sur des données disponibles sous licence type opendata.

Premier article pour l'instant : une classification des communes françaises selon les résultats du premier tour des présidentielles de 2012. Si jamais ça vous intéresse, c'est par ici :

07 Jun 10:01

La fabrique de is the new la construction sociale de

by Baptiste Coulmont

Il me semblait bien que l’expression “la fabrique de” remplaçait, rapidement, l’expression “la construction sociale de”.
Je n’ai pas eu le courage de repérer tous les articles de sciences sociales, j’ai juste compté, sur le catalogue de la BnF, le nombre d’ouvrages portant en titre l’une de ces deux expressions :
fabrique
Et la fabrique remplaça la construction.

06 Jun 11:42

Misinformation can be beautiful too

by Sophy, for Tim
Pachevalier

Très bel article sur les dangers de la dataviz

Undercover Economist

Data visualisation creates powerful, elegant images from complex information, but can also be potentially deceptive

Camouflage usually means blending in. That wasn’t an option for the submarine-dodging battleships of a century ago, which advertised their presence against an ever-changing sea and sky with bow waves and smokestacks. And so dazzle camouflage was born, an abstract riot of squiggles and harlequin patterns. It wasn’t hard to spot a dazzle ship but the challenge for the periscope operator was quickly to judge a ship’s speed and direction before firing a torpedo on a ponderous intercept. Dazzle camouflage was intended to provoke misjudgments, and there is some evidence that it worked.

Now let’s talk about data visualisation, the latest fashion in numerate journalism, albeit one that harks back to the likes of Florence Nightingale. She was not only the most famous nurse in history but the creator of a beautiful visualisation technique, the “Coxcomb diagram”, and the first woman to be elected as a member of the Royal Statistical Society.

Data visualisation creates powerful, elegant images from complex data. It’s like good prose: a pleasure to experience and a force for good in the right hands, but also seductive and potentially deceptive. Because we have less experience of data visualisation than of rhetoric, we are naive, and allow ourselves to be dazzled. Too much data visualisation is the statistical equivalent of dazzle camouflage: striking looks grab our attention but either fail to convey useful information or actively misdirect us.

For a relatively harmless example, consider The New Yorker’s recent online subway map of inequality. “New York has a problem with inequality,” we are told. Then we are invited to click on different subway maps to see a cross-sectional graph, showing us the peaks and troughs of median income along different subway lines. The result is gorgeous but far less informative than a map would have been. It is a piece of art pretending to be a piece of statistical analysis.

A more famous example is David McCandless’s unforgettable animation “Debtris”, in which large blocks fall slowly against an eight-bit soundtrack in homage to the addictive computer game Tetris. Their size indicates their dollar value. “$60bn: estimated cost of Iraq war in 2003” is followed by “$3000bn: estimated total cost of Iraq war”, and then Walmart’s revenue, the UN’s budget, the cost of the financial crisis, and much else.

The animation is pure dazzle camouflage. Statistical apples are compared with statistical oranges throughout. The Iraq comparison, for instance, is not one of “then versus now” as it first appears – but one of what the US Department of Defense once thought it would spend versus a broader estimate, including a financial value on the lives of dead soldiers, and over a trillion dollars of “macroeconomic costs”. The war was a disaster. No need for a statistical bait-and-switch to make that case.

Information can be beautiful, McCandless tells us. Unfortunately misinformation can be beautiful too. Or, as statistical guru Michael Blastland puts it, “We are in danger of making the same statistical mistakes that we’ve always made – only prettier.”

Those beautiful Coxcomb diagrams are no exception. They show the causes of mortality in the Crimean war, and make a powerful case that better hygiene saved lives. But Hugh Small, a biographer of Nightingale, argues that she chose the Coxcomb diagram in order to make exactly this case. A simple bar chart would have been clearer: too clear for Nightingale’s purposes, because it suggested that winter was as much of a killer as poor hygiene was. Nightingale’s presentation of data was masterful. It was also designed not to inform but to persuade. When we look at modern data visualisations, we should remember that.

Also published at ft.com.

06 Jun 11:38

Interactive: The 100 richest people in Finland

by Jens Finnäs

November is the big gossip fest in Finland. Every year in the beginning of the month the tax records from last year are published. In other words: you get to know who made the most money.

Every year the Finnish media outlets do a very conventional presentation of this material. Page after page of lists of top-earners. Rarely does anyone do anything more creative with the data.

I gave it a shot. This is what came out:

Open the interactive visualization in new window.

How?

This is my first visualization in Raphael.js. Previously I have been working with D3 and Protovis, but the weak browser support of these two libraries is becoming a growing concern. Especially when one tries to do sell the work. However, I have found Raphael to be very useful and somehow more intuitive than D3.

The idea for this presentation came from the super-visualization, The Sexperience, by British Channel 4, a survey about the sex life of ordinary Brits (don’t worry, you can open it at work as well). I think the geniality behind this setup is that you can follow the respondents in the quiz from question to question, which gives the user the possibility to explore the relation between different questions instead of just looking at one question at a time. What are for example the sexual preferences of the people who lost their virginity late?

To some extent my presentation of the 100 top earners let you do the same thing. You can select the persons you are interested in and follow them through the presentation. This is a potential of the modern web that I think we will see much more of in the future.

01 Jun 14:48

The arteries of the world, in Tweets

by David Smith

What happens when you plot billions of geotagged Tweets on a map? You can see the arteries of the world. Here's Europe:

MiguelRios_Europe_Tweets

According to creator Miguel Rios (Engineering Manager, Data Visualization at Twitter), the dots on this chart represent every geotagged Tweet since 2009. The color represents number of tweets in the region, and the intensity shows where people move and tweet the most. (Note the maritime shipping lanes!) The chart was created using 20 lines of R code using the ggmap package.

Take a look at some other cities on Twitter's Flickr page, or read more about how this stunning map was created at the link below.

Official Twitter Blog: Give every Twitter user a brush and they will paint you the world — if they geotag their Tweets

29 May 15:12

Companies using Open Source R in 2013

by David Smith

A recent quora post asked an interesting question: What interesting companies, open source projects are using R in 2013? Since we've been tracking applications of R here on the blog for a while now, I listed just some of the most recent examples:

  • The New York Times routinely uses R for interactive and print data visualization.
  • Google has more than 500 R users.
  • The FDA supports the use of R for clinical trials of new drugs.
  • John Deere uses R to forecast crop yields and optimize tractor manufacturing.
  • The National Weather Service uses R to predict the extent of flooding events.
  • Zillow uses R to model housing prices.
  • The Consumer Financial Protection Bureau uses R and other open source tools.
  • Twitter uses R for data science applications on the Twitter database.
  • FourSquare uses R to develop its recommendation engine.
  • Facebook uses R to model all sorts of user behaviour.

Got any other recent examples of interesting companies using R? Let us know in the comments or as an answer to the Quora post linked below.

Quora: What interesting companies, open source projects are using R in 2013

29 May 10:42

Across U.S. Companies, Tax Rates Vary Greatly

Pachevalier

Joli. On perçoit bien la dispersion