Si on peut faire remonter l’apparition de l’humanité sur terre à il y a environ 2,5 millions d’années, avec le genre homo, la question de l’émergence d’un langage articulé reste toujours entière. Les propositions pour dater de ce phénomène demeurent très larges, et s’étendent de -350 000 ans (soit dès l’apparition d’homo sapiens), à des période plus tardives (-100 000 ans et après). La capacité humaine à communiquer via des vocalisations complexes repose en effet à la fois sur des évolutions anatomiques, mais aussi sur des capacités cognitives et sur la socialisation des individus.

Et bien sûr, comme pour beaucoup d’autres compétences humaines, les scientifiques se sont attelé·e·s à identifier les protéines impliquées dans ce phénomène. L’une des premières usual suspects se nomme FOXP2 (pour Forkhead box protein P2). Il s’agit d’un facteur de transcription, soit une protéine qui va se lier à l’ADN pour réguler l’expression d’un gène. On rencontre FOXP2 chez de nombreux vertébrés. Elle va notamment jouer un rôle dans le chant des oiseaux, ou encore l’écholocation des chauves-souris, et chez les humains, les mutations de FOXP2 peuvent aboutir à des troubles du langage. Il s’agit d’une protéine très conservée chez les mammifères. Ainsi, la version humaine de FOXP2 ne diffère de celle des primates non-humains que par deux petites mutations (T303N et N325S), et en 2007, plusieurs équipes de recherche européennes ont montré que ce variant de FOXP2 était également présent chez Néandertal. Notre lointain cousin, qui possédait par ailleurs l’anatomie nécessaire, aurait donc pu faire usage de la parole, mais on ignore toujours si cela fut le cas.

FOXP2 (en vert) dans le rôle de Brunhilde, en interaction avec un double brin d’ADN (en magenta) (pdb 2a07).

Une seconde protéine associée au développement du langage est arrivée récemment sur le devant de la scène. NOVA1 est responsable de l’épissage des ARN, une étape de découpage/ligature des ARN produits lors de la transcription, qui va aboutir à la formation des ARN messagers qui vont quitter le noyau cellulaire pour le cytoplasme et leur traduction par le ribosome. NOVA1 est exprimée dans le système nerveux central, et on la rencontre notamment chez les souris et les humains, où elle est indispensable à un développement neuromusculaire normal. Tout comme FOXP2, la séquence de NOVA1 est particulièrement bien conservée, et le variant humain de cette protéine se caractérise par une unique mutation (I197V). Mais contrairement à FOXP2, les analyses de génome ont montré que cette mutation n’était pas présente, ni chez Néandertal, ni chez les Denisoviens (une autre branche de cousins se sapiens désormais éteinte). Dans le cadre d’une étude parue cette année, des équipes américaines ont introduit le variant humanisé (avec la mutation I197V) de NOVA1 chez des souris. Si à l’échelle moléculaire ce variant semble toujours se lier correctement à l’ARN, les souris porteuses du mutant présentent des vocalisations différentes du reste de leurs congénères. Cette découverte ouvre donc de nouvelles perspectives quant à notre compréhension de l’apparition du langage chez sapiens, et quant à la question de savoir si les autres branches de l’humanité étaient également capable de communiquer ainsi.

NOVA1 (en bleu) dans le rôle de Tosca, en interaction avec de l’ADN (en magenta). La mutation I197V caractéristique du variant humain est montrée en orange (pd 2ann).