Data Scientist“, un anglicisme très en vogue dans le monde des entreprises modernes… Si l’on s’en tient à ce combiné de mots, on traduirait ce métier par “scientifique des données” mais ce serait réducteur tant les expertises des “Data Scientist” sont applicables à de nombreux métiers et secteurs. Pour en savoir plus sur ce métier transverse, encore assez méconnu du grand public, nous sommes allés à la rencontre de Marc Bourotte, éminence “data” de la BCI.

Avec calme et pédagogie, il a accepté de se livrer sur ses études, son parcours, les différentes facettes de son métier et ses tâches quotidiennes à la BCI. Une première conclusion ? L’intelligence artificielle ne remplacera pas l’humain : OUF, on respire !

Sous les spotlights des tropiques, Marc se présente © NeoTech

__

Bonjour Marc et bienvenu sur NeoTech ; première question : comment devient-on « data scientist »… ? 

Salut NeoTech ! Et bien pour devenir « data scientist » il y a plusieurs chemins ; en ce qui me concerne, j’ai suivi un Master en biostatistiques et je viens donc plutôt d’une formation « mathématiques / statistiques ». A mon époque, les « vraies » formations de « data scientist » n’existaient pas encore… Elles ont émergé sur la deuxième moitié des années 2010 lorsque les écoles et universités se sont mises en adéquation avec les besoins du marché. C’est d’ailleurs à cette période que j’ai dispensé des cours à Montpellier dans le cadre de ces nouvelles formations. 

Pour devenir « data scientist », on peut également se former par le tronc « informatique », voir via une formation d’ingénieur généraliste avec des compléments de formation dans l’informatique. Aujourd’hui, il existe des masters spécialisés dans ce domaine et il en existait même un en Nouvelle-Calédonie, le master MIAGE, qui n’était pas spécialisé sur la data science mais qui permettait d’accéder à cette discipline. Nous avons d’ailleurs des anciens étudiants de ce master qui collaborent actuellement à la BCI

__

data
La data à la © BCI

… à la BCI ?

A la BCI, la branche « data science » a été lancée il y a quatre ans, sous l’impulsion de Valérie Rousseau, mon ancienne chef qui était responsable du développement et du marketing. Cette stratégie avait été mise en place à la BRED, notre actionnaire à 49%. Rapidement, Valérie a décelé l’intérêt d’intégrer de telles compétences et de créer un service dédié. 

__

Tu es également Docteur en mathématiques et statistiques : quel est le lien entre ces deux disciplines et ton métier ? 

data
Un métier à la croisée des chemins… © The Product Crew

La « data science » est à la croisée des chemins entre les mathématiques – et, plus spécifiquement, les domaines probabilistes et statistiques qui travaillent sur la modélisation, – entre l’informatique pour fournir les méthodes de traitement de la donnée, la puissance de calcul et le machine learning et entre le « métier ». C’est une science qui est à l’intersection de ces trois domaines de compétences. 

En effet, on a besoin des données qui sont fournies par le « métier », des méthodes informatiques pour traiter, gérer la donnée et des développements mathématiques qui apportent une approche scientifique. Pour résumer, la « data science » est une approche scientifique focalisée sur les données. 

__

Pourrais-tu vulgariser les termes « data » et « scientist » afin d’expliquer à nos lecteurs ce métier capital dans notre monde numérique ? 

L’objectif actuel du « data scientist » dans n’importe quelle structure – entreprises, recherches etc. -, c’est d’aider à la valorisation des données brutes, et d’identifier les bonnes informations à extraire : la data science est un outil d’aide à la décision

Les métiers de la data existaient déjà avant le développement de cette branche mais ils étaient « cachés » sous d’autres dénominations – modélisation probabiliste, statistiques etc. L’avènement d’internet a apporté une gigantesque quantité de données et les solutions technologiques informatiques ont permis leur traitement, leur stockage et de faire tourner des algorithmes dessus. 

Ces nouveautés ont alors créé de nouveaux métiers qui ont pour rôle de valoriser cette prolifération de données en entreprise. On pourrait notamment citer le domaine de la vente avec les CRM et autres outils de recueil de données qui permettent de tirer des informations pour prendre de meilleures décisions… mais aussi le marketing ou des secteurs comme l’agriculture, la médecine etc…

data
Fiche d’un métier d’avenir © Clémentine Jobs

__

Quels sont les principaux projets sur lesquels tu travailles à la BCI ? 

Nous travaillons sur trois types de projets ; tout d’abord, la data science que je viens d’évoquer. En 2021 et 2022, nous avons conçu un progiciel, « Impact », qui ressemble à une sorte de moteur de recommandation qui va permettre à nos conseillers de fournir le bon conseil ou le bon produit, au bon moment, en face de nos clients. L’idée globale, c’est de leur faire gagner du temps d’expertise en les libérant de certaines tâches répétitives et en leur communiquant des informations ciblées qui permettent de faire des propositions personnalisées à leur portefeuille client. 

Le deuxième type de projets concerne la gouvernance de la donnée, un domaine dans lequel j’apporte une certaine expertise après déjà dix années d’expérience ; notre objectif, c’est de casser notre façon de travailler secteur par secteur, département par département, en silos, afin d’uniformiser nos règles de gestion et d’établir une utilisation collégiale des données. Nous avons mis en place un comité transversal aux départements et à la direction pour lancer ces discussions autour de la donnée ; c’est un énorme chantier qui nous a permis, notamment, de lancer notre projet sur la BI. Nous construisons une dynamique collective autour de la donnée. 

Dernier type de projet, les outils de Business Intelligence – logiciels, progiciels etc. : mon rôle est de travailler sur la construction de la BI de la BCI

__

En quoi la « donnée » et son analyse ont-ils transformé en profondeur les métiers de la banque ?

A plusieurs niveaux ! L’analyse de données existaient déjà et permettaient de fournir des outils d’aide à la décision mais, la « data science » a permis d’apporter des analyses plus fines sur la construction d’objectifs ambitieux mais réalistes par exemple. L’idée c’est de s’appuyer sur une approche scientifique afin de systématiquement apporter à la Direction les éléments nécessaires aux bonnes prises de décision.

L’outil que nous avons développé permet avant tout à nos collaborateurs de gagner du temps pour qu’ils se concentrent sur leur cœur de métier, le conseil, et s’emploient à des tâches à forte valeur ajoutée. Derrière cette idée d’automatisation, c’est finalement plus de temps pour « traiter » l’humain au quotidien et apporter des réponses précises à des besoins qui ne sont parfois pas identifiés par nos clients. 

La « data science » n’est pas là pour remplacer l’humain mais pour lui permettre de passer plus de temps sur des sujets d’expertises que l’intelligence artificielle ne sera pas capable de traiter. Je reste persuadé que l’humain est le plus à même de traiter l’humain ! Je ne suis pas sûr qu’on puisse, même à terme, remplacer l’humain par une intelligence artificielle ! Même si certains pensent le contraire, je crois qu’on va détruire des postes à faible valeur ajoutée, facilement remplaçables par des formes d’automatisation, mais certaines activités humaines, que ce soit dans l’art ou dans d’autres domaines, ne pourront pas être remplacées. Il faut bien comprendre que, le jour où un algorithme aura remplacé tout le monde, il ne pourra plus apprendre que sur lui-même et il risque ainsi de s’enfermer dans certains biais. L’intelligence artificielle finira par tourner en rond et je ne suis pas certain qu’elle aura un jour l’étincelle de la créativité par exemple… 

__

Quel est ton regard sur la maturité de notre territoire quant à l’usage de la data ? Quels sont les forces et faiblesses du « marché calédonien » ? 

Ça fait presque quatre ans que je suis arrivé sur le « marché calédonien » et je ne le trouve pas autant en retard qu’on veut bien le dire, même par rapport à la métropole ; la preuve ? La BCI, la SLN ou d’autres grosses entreprises font déjà appel aux expertises spécifiques des data scientists et d’autres entreprises ont également saisi le train en marche. On peut ressentir cette émulation dans les événements également : l’Ocean Hackathon en est un bel exemple… 

Ocean Hackathon
Cérémonie de remise des prix de l’Ocean Hackathon NC © NeoTech

Néanmoins, et c’est également compliqué sur d’autres marchés, il faut que ces technologies descendent des grandes entreprises aux PME qui génèrent également beaucoup de données ; il faut réfléchir sur l’offre qu’on pourrait leur proposer car, forcément, un « data scientist » à un coût mais c’est à nous de réfléchir à des solutions packagées qu’on pourrait offrir à ce tissu économique important pour le territoire. La Nouvelle-Calédonie est un superbe terrain de jeu, bourré d’opportunités et l’apport de compétences extérieures nous permettra de poursuivre son développement. 

J’espère qu’on pourra également développer la formation « in situ » : le domaine de la data science manque de compétences mais c’est également le cas sur la BI et sur la gouvernance. Il existe un réel manque de compétences locales et ce serait une bonne chose que le secteur de la formation y travaille même si ça prendra du temps… 

__

Tu as également fondé une startup qui s’appelle « NoumIA » : quelle est sa raison d’être ? 

C’est une startup qui fournit du conseil en data science ; mon objectif, c’est justement d’aller vers ces moyennes entreprises qui ont de la donnée mais pas la nécessité d’avoir un data scientist à temps plein. La plupart du temps, la première étape est de réaliser un « POC » – Proof Of Concept – après avoir réalisé un audit et une analyse poussée de leurs problématiques économiques ou techniques. 

A partir de là, mon rôle est de les aider à développer une solution interne adaptée ou de s’appuyer sur une solution externe qui existe déjà ; le « POC » sert à prouver qu’on est capable de créer de la valeur grâce à leurs données. Une fois le « POC » validé et l’interlocuteur convaincu, l’objectif est de passer sur une phase d’industrialisation et une mise en production dans leur système d’information. 

__

Tu collabores avec Jean-Simon Chaudier sur un projet « Fire Tracking » qui permet d’identifier les départs de feu et d’alerter au plus vite les pompiers. Où en est ce projet actuellement ? 

Et bien écoute, avec Jean-Simon, on se voit régulièrement sur ce projet qui vise à détecter, grâce à la reconnaissance d’images, les départs de feu afin d’alerter automatiquement les pompiers le plus rapidement possible ; nous ne sommes pas loin du « kick-off » technique : les équipes sont déjà constituées mais on est encore en attente de validation de certaines subventions… Le temps des institutions n’est pas le temps du privé ! 

En tant que « data scientist », j’interviens à deux niveaux ; d’une part, je travaille sur la construction des algorithmes en supervisant des étudiants de l’école des Mines de Nancy qui nous ont accompagné sur le projet. Dans notre cas, ce sont des algorithmes de reconnaissance d’images qui sont désormais fiables et utilisés dans d’autres cas pratiques. Au cours de notre « POC », nous avons démontré que nos algorithmes sont efficaces. 

La phase d’industrialisation va nous permettre d’intégrer cet algorithme dans une solution en étant capables de gérer de bout en bout le traitement des données : recevoir l’image, détecter le feu, déclencher une alerte etc… tout en étant capables de faire entrer les nouvelles images dans notre banque et que l’algorithme se nourrisse de ces nouveaux clichés. C’est ce second niveau d’intervention sur lequel je travaille actuellement : mettre en production le produit et gérer tout son cycle de développement. 

__

Question « fun » pour terminer : si tu pouvais avoir accès à n’importe quelle base de données d’une organisation dans le monde, laquelle choisirais-tu et pourquoi ? 

Tinder ! Aller, ce sera la petite touche comique pour clore notre discussion… 

data
Touché, coulé ! © Topito

__