Après avoir récemment soutenu sa thèse de doctorat en informatique et en science des données, Jannaï Tokotoko enseignant contractuel à l’UNC, s’est donné pour mission d’utiliser la donnée, cet or numérique, et les technologies innovantes comme l’intelligence artificielle, pour valoriser les espaces claniques afin d’optimiser leur développement économique. Fondateur d’une startup d’iA nommée “Intelligence artificielle des îles“, concepteur de plusieurs projets technologiques ambitieux, le jeune Docteur consacre ses expertises à rassembler et connecter les “sociétés” calédoniennes. Échanges avec un homme qui utilise les technologies pour dessiner un avenir calédonien 3.0 !

Jannaï Tokotoko, le Doc, vous salue bien bas ! © NeoTech

__

Salut Jannaï ! Tout d’abord, une excellente année à toi et à tes proches ! On peut commencer notre échange par te demander quelles sont tes bonnes résolutions ? 

Bonjour, bonne année à tous les lecteurs et merci à NeoTech pour l’invitation ! Côté résolutions, je vous souhaite à tous une bonne santé pour 2023, de très belles choses, de l’argent, bien sûr… 

De notre côté, on travaille sur tout ce qui concerne les espaces claniques afin d’apporter des outils d’aide à l’aménagement des espaces coutumiers, leur valorisation culturelle, la reconnaissance juridique de ce patrimoine et le potentiel développement économique associé. Pour ce faire, nous nous appuyons sur les technologies  de collecte, d’analyse et d’affichage de données : les systèmes d’information, les technologies innovantes comme l’intelligence artificielle… Voilà les projets que nous allons concrétiser en 2023 ! 

__

Il y a un mois, tu soutenais ta thèse de doctorat en informatique sur le sujet « Big Data et science des données pour le suivi des ressources naturelles ». Peux-tu définir les termes clés pour nos lecteurs ? 

Ma thèse s’est faite sous la direction de Nazha Selmaoui, Professeure en informatique à l’Université de la Nouvelle-Calédonie, et Hugues Lemonnier HDR, chercheur en aquaculture de l’IFREMER.

Le « big data » est une tendance de la dernière décennie ; on parle de « big data » lorsqu’on souhaite traiter une grosse quantité de données grâce aux outils de calculs modernes : PC, micro-processeurs, GPU etc… A notre époque, des quantités de données phénoménales sont enregistrées dans les systèmes d’information des entreprises mais on ne peut plus passer par des « modèles statistiques » car ladite quantité de données est trop importante. Le « big data », c’est donc la combinaison de ces outils, de ces données et des algorithmes d’apprentissage automatique développés pour les traiter et les organiser.  

La science des données a, quant à elle, pour objet, par exemple, l’extraction d’informations utiles ; elle comprend le développement et l’utilisation des algorithmes mais également les différents types d’approches qui ont été mis en place pour traiter ces données. Par exemple, on peut les superviser par une cible, ou avoir une approche exploratoire, ou encore chercher à optimiser un gain…

informatique
La “data” est le point de départ d’un raisonnement © Jannai Tokotoko

__

Allons plus loin maintenant : en quoi consistait cette thèse ? 

Effectivement, j’ai soutenu ma thèse en informatique le 12 décembre 2022 autour de la problématique “Big Data et science des données pour le suivi des ressources naturelles” ; pour vulgariser, ma thèse concernait la sécurité alimentaire et, plus particulièrement, l’apport de nourriture de qualité grâce à une analyse des données générées dans les filières de production de ressources naturelles. Les démographes ont montré que la population augmentait et qu’il fallait subvenir à ses besoins, notamment en ce qui concerne les produits de la mer qui proviennent principalement de l’élevage : poissons mais aussi crevettes, crustacés etc… 

Il faut comprendre que les ressources halieutiques vont finir par manquer par rapport à l’augmentation de la consommation de la population et qu’il va ainsi être nécessaire de produire grâce à l’élevage pour nourrir la population. La question sous-jacente, c’est « comment développer et organiser l’agro-industrie et ses filières ? ». 

Le but de ma thèse, c’était de modéliser l’évolution de la qualité du milieu des élevages et d’analyser la qualité du produit en fin d’élevage ; dans ce contexte, je me suis intéressé à la deuxième ressource calédonienne exportée à l’international après le nickel : la crevetticulture

Si vous avez quelques heures à consacrer, on vous recommande vivement d’écouter la soutenance de thèse de © Jannai Tokotoko

__

Autre question capitale : en quoi la data est-elle utile pour optimiser la gestion de ces ressources ? 

informatique
Elle est pas belle notre crevette calédonienne ? © SOPAC

Ma thèse avait pour objectif de croiser des données complexes relevées durant l’élevage sur une vingtaine d’années – salinité de l’eau, évolution de température, quantité d’oxygène dissous au cours du temps etc. Dans ce contexte, chaque « ferme » relève ces données de qualité de l’eau quotidiennement ou hebdomadairement de manière semi-automatique et elles sont ensuite enregistrées et centralisées dans une base de données créée avec le soutien technique de l’IFREMER

En fin d’élevage, la SOPAC, la société qui conditionne tous ces produits, fournit des informations sur la qualité de la crevette en fonction de critères spécifiques et en détermine la qualité et le prix.  

Je vais vous donner une définition que j’ai trouvée sur internet :

“La data est le point de départ d’un raisonnement” 

En effet , elle permet de réaliser un suivi d’un écosystème ou d’un environnement et de ses cycles mais également d’étudier l’impact des activités entropiques et des catastrophes naturelles. C’est grâce à ces données que l’on peut mieux comprendre ces phénomènes, leurs origines et leurs impacts sur les ressources naturelles. Ce sont elles, également, qui permettent de créer des modèles descriptifs mais aussi des modèles prédictifs

__

Quelles sont les principales conclusions de ta thèse ? Quelles suites vas-tu lui donner ?

Cette thèse intervient dans le contexte de la sécurité alimentaire ; certaines maladies se développent pendant l’élevage et impactent automatiquement la production et donc la rentabilité de la filière. Nous sommes un territoire avec de nombreuses ressources maritimes mais je suis convaincu que la filière aquacole doit être valorisée car, si un jour, on vient à manquer de nickel, cette filière pourrait prendre le relai économiquement parlant. 

Comprendre l’arrivée des maladies et ses causes, c’est optimiser la production et la qualité de l’environnement afin d’éviter la propagation des maladies. Je me suis appuyé sur trois des données que nous avons classé en trois types : les « variables forçantes »  de gestion et de performances d’élevage. On tient aussi compte de l’alimentation des crustacés et des données zootechniques, celles qui sont en lien avec la croissance des populations de crevettes. Dernier type de données, la qualité de production à travers les défauts visibles sur l’animal. 

informatique
Des données classées en trois types © Jannai Tokotoko

Dans le cadre de ce travail, j’ai créé un nouvel algorithme, « Xmeans-MMTS », qui tient compte de toutes ces variables afin de créer des groupes d’élevage homogènes et des modèles exploratoires. Par exemple, avec cet algo, je peux affirmer que lorsque la température de l’eau est comprise entre tel ou tel intervalle en début d’élevage combiné à un certain taux de renouvellement d’eau, j’aurais un taux de survie de « X » et une qualité de sortie de « Y ».  

informatique
Jannai ici et Jannai là ! © Jannai Tokotoko

Plusieurs articles issus de cette recherche ont été publiés et présentés dans des conférences à Paris, en Italie à Singapour et en Australie et la startup Bayntel, actuellement en cours de création, permettra d’intégrer ces modèles dans des applications web et mobiles ergonomiques destinés aux éleveurs.

__

Suivre nos ressources naturelles est effectivement un enjeu important mais prédire leur évolution et/ou leur dégradation pour anticiper l’est sans doute encore plus. Quels sont les outils technologiques à disposition pour tenter de prédire leur avenir et donc de les préserver au mieux ? 

On peut parler des outils d’apprentissage automatique qui sont basés sur un archivage de données numérisées. L’algorithme va considérer une distance entre sa réponse et la réponse réelle puis il va apprendre de la différence résiduelle et chercher à la réduire au maximum pour prédire la réalité. C’est comme un élève qui chercherait à réduire la différence entre sa note et la note maximale de 20/20… A partir des données complexes (évolution de la qualité du milieu d’élevage, apport en aliment quotidien…), l’algorithme va ainsi être en mesure de prédire la qualité des produits à la fin de leur production. 

On pourrait aussi évoquer les outils ou protocoles d’acquisition des données ; ces données peuvent être acquises soit automatiquement, par des capteurs connectés, l’IoT ou images satellitaires par exemple, ou manuellement, par des observateurs. Dans les deux cas, il existe bel et bien des biais qui travestissent la qualité de la donnée ; dans le cas humain, c’est la subjectivité de l’acquisition et dans le cas de la machine, c’est le fonctionnement même des objets connectés qui peut être défaillant. Ces données ne sont donc pas purement objectives et doivent ainsi être prétraitées en entrée. Néanmoins, ces technologies permettent de récolter des données en grande quantité et donc de nourrir les algorithmes prédictifs

Dans cette logique de prédiction, il ne faut pas mettre de côté les articles scientifiques mais surtout les connaissances issues des peuples autochtones qui sont centenaires et calibrées sur l’écologie. Ça aussi, ce sont des outils pertinents qui doivent être pris en compte ! Et, dernière nouveauté, on parle désormais de « doubles » ou de « jumeaux numériques » des milieux naturels ; ce concept très récent sur lequel travaillent de nombreux chercheurs propose de créer un univers parallèle virtuel représentatif de la réalité et de tester sur ces environnements digitaux les conséquences des actes et des décisions prises. C’est une nouvelle forme de prédiction qui repose néanmoins, elle aussi, sur la donnée. 

__

En parlant des connaissances des peuples, on oppose régulièrement les termes de « nature » et « culture » ; or, dans ta thèse, on peut considérer que ces deux termes, représentés successivement par « ressources naturelles » et « science des données », sont complémentaires. Quel est ton point de vue sur ce sujet philosophique ? 

Les premiers réseaux de neurones cherchaient à représenter le cerveau humain et donc la nature ! Si on prend en considération les machines industrielles, avions, voitures etc., on se rend compte qu’elles s’appuient sur la nature. On retrouve également cette logique dans les principes de base  de la science des données (algorithme d’apprentissage…).

Est-ce que c’est l’homme qui s’adapte à la nature ou la nature qui s’adapte à l’homme ? C’est une question que je me pose souvent car il y a une relation ‘obligée’ entre ces deux entités !  Je crois que la nature nous pousse à faire des changements à l’échelle mondiale, qu’elle nous envoie des messages « écologiques » assez clairs pour qu’on prenne conscience que tout est connecté et interdépendant et que les êtres humains font partie intégrante de ce tout. Détruire la nature, c’est finalement détruire la culture car les deux notions sont indiscutablement liées ! 

__

Tu travailles également sur différents projets technologiques, peux-tu nous en parler ? 

informatique
Une startup calédonienne, prochain hippocampe international ? © Jannai Tokotoko

Notre pays est socialement et économiquement un peu morose, presque “bloqué”, et nous devons, depuis trente ans, mettre en place un projet de société qu’on attend toujours… La société est basée sur des actes juridiques, des actes de conservation, d’administration du patrimoine  etc… qui n’existent pas dans l’organisation sociale kanak. Ces structures et ces données existent intrinsèquement dans notre organisation mais ne sont pas digitalisées. Notre ambition, c’est de les digitaliser et de créer des systèmes d’information adaptés à cette organisation sociale spécifique afin de créer des interopérabilités entre les deux sociétés, à partir d’outils destinés aux personnes ayant un lien particulier et historique à la terre.

Pour ce faire, nous avons créé « IAI », Intelligence Artificielle des Îles, une société qui propose aux clans des outils d’aide à la reconnaissance juridique du patrimoine et à la valorisation culturelle kanak. La première étape, c’est de considérer le lien à la terre et de créer des outils qui permettent de le représenter : positionner les reflétants, délimiter les espaces de vie etc. grâce à la blockchain ; ces données vont permettre de créer des cartes et donc des outils de médiation en cas de conflits. L’objectif, à terme, c’est également de créer une forme de fiscalité adaptée aux liens des clans avec leurs terres mais également de permettre aux entrepreneurs kanak de disposer des smart-contrats pour dialoguer avec des investisseurs, collectivités et autres tierces parties. Une forme d’interopérabilité locale mais également internationale. Petit complément, IAI a été retenu finaliste du concours IOM7 Innovation Outre-Mer. Elle est aujourd’hui incubée à la Station N à Nouville.

__

Sur quelles données vous appuyez-vous pour créer ces cartographies des terres ? 

On s’appuie sur des données d’images satellitaires et images d’archives ; plusieurs géomètres ont déjà fait les délimitations grossières et des cartographies de chevauchement lors de leurs passages en terres coutumières et on récolte aussi des informations auprès des populations locales qui nous partagent ces délimitations de terrain. Il existe une véritable mémoire collective dans nos tribus : toutes ces données orales peuvent et vont être digitalisées.

informatique
La terre, le coeur du sujet calédonien (et de son avenir) © Jannai Tokotoko

__

N’existe-t-il pas une certaine forme de fracture technologique entre la population kanak et les outils que vous proposez ? 

On a toujours l’impression que les gens sont dans leur milieu familial à cultiver ou pêcher mais certains sont déjà très connectés aux outils de trading par exemple. D’autre part, dans certains endroits, ils manquent encore de certains services de base tels que l’eau ou l’électricité… Délimiter les terres des clans permettra de faciliter l’installation de ces services car les plans d’aménagement des collectivités ne prennent pas en compte les terres coutumières : c’est le nœud du problème. Je profite de cette interview pour aborder un sujet qui doit attirer notre attention ; dans certaines zones, on a installé une connexion internet alors qu’il n’y a pas d’eau, ni d’électricité alors peut-être qu’avant de pousser la transformation numérique, il faut veiller à ce que ces besoins primaires soient satisfaits ! 

Depuis plus de trente ans, la problématique de fond qui revient dans les discussions politiques et sociales, c’est la terre ! Malgré ces problématiques, certaines choses ont été réalisées, notamment des usines au sud et au nord mais il va bien falloir trouver des solutions pour stabiliser le système global et amener les deux sociétés à se parler et à construire ensemble. Tout le monde aspire à faire partie de l’économie, kanak ou pas, mais il va falloir créer des activités, développer le tourisme de luxe par exemple, proposer des formations dans ce sens et valoriser scientifiquement des connaissances spécifiques aux tribus pour donner de la visibilité à notre identité et notre histoire, pour gagner de l’argent et se faire connaître à l’international. 

informatique
Les terres coutumières bientôt “SMART” ? © Jannai Tokotoko

__

Et pour clore notre discussion, en tant qu’informaticien, quel logiciel rêverais-tu de développer et à quelles fins ? 

On est dans une société où on a produit un trop grand nombre d’informations et où on en consomme de trop, ce qui nous empêche parfois de faire la part des choses…

Ce qui serait bien, c’est de pouvoir taper dans la base de données de Dieu qui détient les seules données qui comptent !

Jannai et les portes du paradis de la data

Mon logiciel miracle aurait la possibilité de requêter dans cette base de données et de connaître LA vérité : une sorte de ChatGPT connecté avec Dieu. C’est le savoir qui nous a divisé et c’est désormais le savoir qui doit nous rassembler ! 

__