dimanche 30 octobre 2011

Dennis Ritchie Day - parceque pas seulement Steve il est important

Cliquez sur l'image
Tim O'Reilly, sur le blog Radar de sa maison d’édition, lance un appel pour que le 30 octobre soit Dennis Ritchie Day, en souvenir du co-créateur de C et de Unix. Et parce que Steve Jobs a eu droit a une journée officielle en Californie, alors que le New Jersey ne semble pas prêt à organiser une telle reconnaissance pour Dennis Ritchie.

Avant que les sentiments ne deviennent irrationnels dans le genre Ritchie (resp Jobs) était un génie, Jobs (resp Ritchie) une pauvre merde, j'attire votre attention sur le fait que Tim O'Reilly, qui sait de quoi qu'il cause, a également écrit un billet recent en souvenir de Steve Jobs. Lisez ce qu'il a à dire et sur l'un et sur l'autre avant de juger à l'emporte-pièce. (Je parle de l'oeuvre informatique, pas de si les gars étaient sympas.)

Et puis une pensée pour le créateur de Lisp et pionnier de l'intelligence artificielle, John McCarty, mort également très récemment, et dont presque personne ne cause. Ach so.

vendredi 28 octobre 2011

diversité du peer review


Les trompettes de la renommée par jrobinss (ça change des petits mickeys)

Je me suis rendu compte lors d'une discussion sur Futura-Sciences, que la façon dont la publication scientifique fonctionne n'est pas claire pour beaucoup de personnes hors de notre tour d'ivoire. Voici donc un petit tour d'horizon, du point de vue d'un bioinformaticien.

Le modèle le plus classique est celui du journal spécialisé visant une certaine qualité. Les étapes sont alors les suivantes :
  1. Le manuscrit est reçu par un éditeur, qui est un spécialiste du domaine. Celui-ci juge s'il s'agit du type d'articles que son journal publie (domaine adéquat, écrit en anglais scientifique compréhensible). Si non, tcho. Si oui, étape suivante. Selon les journaux, entre 5% et plus de 50% des articles peuvent être rejetés à cette étape. Surtout que nombre d'éditeurs incluent dans leurs critères que le manuscrit promet de résoudre une question suffisamment importante pour leur super-duper-journal.
  2. L'éditeur choisit des experts, auxquels il envoie le manuscrit, sans masquer les auteurs. Les experts renvoient des rapports sur la qualité du manuscrit et son adéquation au journal.
  3. L'éditeur se base sur les rapports de experts pour prendre une décision. En général, le choix est : accepté tel quel (rare), accepté après changements mineurs (les experts n'auront pas besoin de re-juger), changements majeurs demandés (les experts devront rejuger, ça peut encore être accepté ou refusé après cela), ou rejeté.
  4. Les auteurs reçoivent la décision de l'éditeur accompagné des rapports anonymes des experts. Ils peuvent faire appel.
Plein de problèmes, dont le plus évident est l'asymmétrie entre les experts qui connaissent les auteurs (ce qui peut biaiser leur jugement), et les auteurs qui ne connaissent pas les experts (qui peuvent donc être salauds sans risque). Je suis personnellement favorable au double anonymat, mais c'est très rare que ce soit fait. Autre problème, l'éditeur est finalement seul maître à bord (un peu comme un arbitre dans un stade), et s'il est injuste ou incompétent c'est dommage. Heureusement il existe plein de journaux scientifiques spécialisés, donc généralement à ce niveau-là on peut s'en sortir.

Première variante, le journal méga-super-connu, typiquement Nature ou Science. A toutes les étapes, une évaluation de l'importance de la contribution est plus importante que la qualité du travail lui-même. C'est un peu la première page du Monde. C'est bien si c'est correct, mais il faut aussi que ça intéresse beaucoup de monde tout en respectant l'image plus ou moins sérieuse du journal. Le problème, c'est que les critères sont très discutables. De plus, les problèmes classiques sont amplifiés par l'importance qu'une publication dans ces journaux peut avoir pour une carrière, et le niveau de compétition correspondant. Finalement, une grosse différence est que les éditeurs sont des professionnels qui ont généralement une formation scientifique, mais ne travaillent pas comme chercheurs depuis des années. Alors que les éditeurs des journaux de spécialité sont censés être les meilleurs dans leur domaine, ceux-ci sont plutôt des personnes qui changé de métier parce qu'elles n'aimaient pas la carrière de chercheur.

Ces deux variantes existent depuis longtemps, mais avec Internet d'autres apparaissent.

D'abord, ArXiv, dont on a déjà parlé. Pas d'experts, et des éditeurs qui s'assurent juste que c'est plus ou moins scientifique. Le problème, c'est qu'on n'a aucun critère de qualité. Le bon grain et l'ivraie se couchent avec l'agneau et le lion. Ou quelque chose comme ça.

Ensuite, Biology Direct. Les auteurs reçoivent les rapports des experts non anonymes. Ce sont les auteurs qui décident de la suite à donner (changements ou pas, publier ou pas). Si les auteurs décident de publier, c'est fait, accompagné des commentaires (toujours non anonymes) des experts. Une idée qui paraît attirante, mais marche très mal en pratique. Les bons auteurs auront des scrupules à publier leur papier, les mauvais, non. Les chercheurs connus feront des critiques fortes, les chercheurs en début de carrière seront beaucoup plus hésitants.

Un modèle qui a un très fort succès, exemplifié par PLoS One, est de supprimer totalement les critères de pertinence et de significativité de l'avancée scientifique. Tout ce qui est correct et n'est pas totalement redondant avec des résultats précédemment publiés doit être publié. PLoS One est devenu le journal qui publie le plus d'articles scientifique par an, et a notamment une bonne réputation en recherche médicale. Curieusement, de nombreux collègues restent persuadés qu'il n'y a pas d'experts (il y en a, pareil que dans la formule classique), et que c'est un journal poubelle. C'est vrai que beaucoup d'articles de faible intérêt y sont publiés, mais aussi de très bons articles, parfois parce les auteurs voulaient publier vite sans s'embéter à se battre avec les éditeurs de grands journaux, parfois parce qu'il n'existait pas de journal de spécialité correspondant (pour de la recherche interdisciplinaire).

Le modèle le plus récent à ma connaissance est celui de Frontiers, une nouvelle série de journaux sur internet. Les experts et les auteurs dialoguent à travers un système anonyme, jusqu'à trouver un accord sur la publication ou pas de l'article, éventuellement après modifications. Cela rappelle un système qui existe pour certaines conférences d'informatique, mais où ce sont seulement les experts qui doivent discuter entre eux, de manière non anynome ; ça évite au moins l'éditeur seul maître après Dieu (et quand on connaît le rôle de Dieu en science...).

Après ce tour d'horizon des mille et une recettes, qui vous valent à coup sûr les honneurs des gazettes...

vendredi 21 octobre 2011

test de l'oignon

cliquez sur l'image
Intuitivement, on s'attends à ce que les organismes plus complexes aient besoin d'un génome plus complexe pour coder tout ça. Pas du tout, il n'y a aucun rapport évident entre complexité de l'organisme et taille du génome. Cela s'appelle le "paradoxe C". (Parce qu'au temps où on savait peu de choses sur l'ADN, on avait remarqué que tous les individus d'une espèce en avaient autant ; oh une constante dirent les biologistes envieux des physiciens, appellons-la "C" ; ergo C = quantité d'ADN par cellule dans une espèce, et on s'en fout ; pourquoi ? on y vient.)

Solution au paradoxe C : c'est pas tout des gènes, loin de là. Donc les organismes plus complexes ont plus de gènes, peu importante l'ADN pourvu qu'on ait les protéines. Alors et de une, ça ne marche pas non plus. Vers nématode, 1000 cellules à tout casser, 20 000 gènes. Humain, capable d'inventer des bombes atomiques, 20 000 gènes (vous me direz, il a des transcrits alternatifs ; allez lire Sandwalk et laissez-moi tranquille). Argl gosh. Et de deux, ça laisse un autre problème vexant : à quoi sert tout cet ADN qui n'est pas des gènes ?

Alors il y a deux écoles en gros :
  1. Ceux qui disent que ça doit forcément servir à quelque chose, mais on ne sait pas encore à quoi. Ils poussent des cris de victoire chaque fois qu'un article découvre une nouvelle fonction pour 0,1% du génome humain. Curieusement, ils se recrutent dans deux camps : les né0-Darwinistes orthodoxes, pour qui toute l'évolution s'explique forcément par la sélection naturelle, donc tout doit servir à quelque chose. Et les créationistes, pour qui tout a été crée par le Père Noël pour une raison, et donc doit servir à quelque chose. (Pas si curieusement que ça au fond : le Darwinisme est une réponse à la théologie naturelle, les deux répondent à la question de l'adaptation fonctionnelle des organismes, et s'opposent aux approches dites structuralistes, qui répondent à la question de la forme des organismes, y compris ce qui ne sert à rien.) (trop de parenthèses aujourd'hui, vous ne trouvez pas ?) (trop de parenthèse tue la parenthèse.
  2. Et ceux qui disent que non c'est de la merde ("junk" en jargon technique), ça ne sert à rien. Plutôt des neutralistes, à savoir des gens qui pensent que la plus grande partie de l'évolution moléculaire est due au hasard.
Et c'est là que viennent les onions oignons. T. Ryan Gregory, qui étudie les variations de taille des génomes, a proposé le test de l'oignon pour tous ceux qui déclarent avoir trouvé l'explication ultime pourquoi tout cet ADN sert à quelque chose (quelle phrase moche mais j'ai la flemme de chercher mieux). Le test c'est que votre explication doit expliquer deux choses simples : pourquoi l'oignon que l'on mange, Allium cepa, a 17 pg d'ADN alors que nous les humains n'en avons que 3,5 pg. Et pourquoi des espèces d'oignonoïdes qui se ressemblent et vivent heureusement à l'état de nature ont entre 7 et 31,5 pg d'ADN. S'il y a des biologistes moléculaires qui me lisent, tous les détails techniques du défi sur le blog de Gregory.


Vous aurez deviné que je me classe dans les neutralistes bien sûr. Comme tous les gens beaux, drôles et intelligents. Voir aussi cette excellente collection d'essais sur le blog Sandwalk (par un prof de biochimie canadien).

vendredi 14 octobre 2011

Facebook : quand on croit que ça ne peut pas être pire, mais si

cliquez sur l'image
Bon je vais le dire ouvertement : je n'ai pas de compte Facebook, je n'aime pas Facebook, je suis un vieux con, voilà.

Mais y a de quoi (ne pas aimer Facebook, pas de quoi être un vieux con - quoique).

Si vous cliquez sur l'image ci-dessus, vous n'arriverez pas sur un dessin rigolo, mais sur une animation de l'érosion de votre droit à la vie privée sur Facebook entre 2005 et 2010.

Plus récemment, un collectif Europe vs. Facebook a décidé d'obtenir leurs données Facebook, se basant sur le droit irlandais (Facebook Europe est basé en Irlande). D'abord ça n'est pas facile, ensuite les données sont fournies de manière peu commode, mais surtout des informations étaient manquantes. Et comme on l'apprends en lisant Zdnet (trouvé via Slashdot), Facebook considère qu'une partie de vos informations privées, vous concernant directement, que vous leur avait fourni (je suis clair là ?), leur appartiennent et constituent un secret industriel qu'ils ne peuvent donc pas divulguer - y compris à vous.

Nous vivons une époque moderne.

jeudi 13 octobre 2011

printf("Goodbye world.\n");

cliquez sur l'image à vos risques et périls
Dennis Ritchie, inventeur du language C et co-inventeur d'unix, est mort. Il était l'auteur du livre "Kernigan et Ritchie - The C programming language", avec lequel j'ai appris à programmer un vrai langage, et qui a introduit me semble-t-il l'exemple de programmation
printf("hello world\n");


(titre de ce post piqué au premier commentaire sur boingboing)

lundi 10 octobre 2011

Les blogs continuent leur marche en science

cliquez sur l'image
Oui, je sais, on a 5 ans de retard à l'université par rapport à l'usage que font les gamins. Sales gosses.

Bref, je voulais raconter quelques histoires de blogs en science et éducation.

  • Jonathan Eisen, scientifique reconnu dans l'étude des génomes, a invité un collègue qui a publié un papier controversé à en parler sur son blog. D'autres collègues ont commenté. J'ai proposé de transformer cette discussion en symposium dans un congrès scientifique international. Ledit symposium est en préparation, et est donc né d'une discussion sur un blog.
  • Les étudiants de notre école doctorale (les gens qui font des thèses quoi) doivent participer à des discussions d'articles qui leurs donnent des points à valider. On a décidé de remplacer la validation par présentation Powerpoint chiante par une entrée de blog crée pour l'occasion, pour notre discussion de Génomes, écologie, évolution, etc.
  • Joe Thornton, un biologiste évolutif connu pour son travail sur les récepteurs aux hormones stéroïdes, a répondu en détail aux conneries des créationistes qui déforment son travail, sur un blog.
  • Ewan Birney, grand bioinformaticien devant l'éternel, a complété un article dans un journal sérieux (Genome Research) par trois posts de blog [1] [2] [3] sur l'avenir de la compression de données en bioinformatique. Plein de choses intéressantes qu'il ne pouvait pas mettre dans le format article traditionnel.
  • Tom Roud, le Café des sciences, et d'autres, ont lancé une initiative pour faire parler les candidats à l'élection présidentielle française de science. Y a du boulot, le président et le premier ministre se battent pour assister à un match de foot important, et brillent par leur absence pour féliciter un français qui gagne un prix Nobel.
Je ne sais pas si vous avez remarqué, mais c'est beaucoup en anglais. Si j'ai un temps infini à disposition, je commenterais d'avantage sur certains de ces points en français. Sinon, bin faut lire l'anglais. On vous avait bien dit de travailler à l'école.

jeudi 6 octobre 2011

iphone contre nobel

J'avais prévu pour ce post d'apparaître demain matin, mais étant donné l'actualité j'ai décidé de l'avancer. Curieusement, pour le moment, "Steve Jobs" n'est pas une recherche très fréquente sur Google Trends. Peut-être parce que c'est encore la nuit aux Etats-Unis.

cliquez sur l'image
En ce moment c'est la saison des prix Nobel, évènement majeur de la connaissance et la culture humaine, dont on se souviendra pour les siècles à venir.

Et aussi, y a un nouvel iphone qui sort (je mets pas de lien, vous vous débrouillez là hein).

Après avoir vérifié moi-même les nouvelles pour l'iphone (une vingtaine de fois) et pour le Nobel (3-4 fois), je me suis demandé si mon comportement était anormal. Alors, idiot, oui, anormal, malheureusement pas.

Ci-dessous, les statistiques de Google trends : en haut, les recherches par les internautes, dominées par l'iphone (en bleu), alors que l'on voit à peine le Nobel (en rouge). Dessous, la couverture (d'après Google) par les sites internet d'information, ou les deux sont plus équilibrés.


Autant pour la "sagesse des foules".

lundi 3 octobre 2011

infographie


Cliquez sur l'image ci-dessus, qui présente un résumé amusant et pertinent de toutes les infographies que vous verrez par ailleurs.