Article réservé aux abonnés Archimag.com

Comment s'approprier le big data quand on n'est pas data scientist ?

  • citizen_datascientist.jpg

    data-scientist
    Seulement 20 % des entreprises utilisent les outils sur lesquels travaillent les data scientists. (Freepik/Rawpixel)
  • La data science ou science des données est un domaine technique difficile à gérer pour un grand nombre d’entreprises et recruter un data scientist, profil très recherché, mais également très coûteux, n’est pas à la portée de toutes. Heureusement, pour parvenir à interpréter des données si prometteuses, les outils se démocratisent.

    Près de 75 % des entreprises comptent implémenter l’intelligence artificielle et le big data d’ici 2020. C’est ce que révèle un sondage mené par le magazine The Economist auprès de plus de 200 responsables d’entreprise.

    La question d’exploiter ces données massives devient donc primordiale pour les entreprises de toutes tailles afin de rester compétitives.

    Nouveaux héros

    Qualifié de « job le plus sexy du XXIe siècle » par la Harvard Business Review (une revue américaine sur le monde de l’entreprise), le data scientist donne du sens aux données recueillies de sources diverses. Les compétences du data scientist se situent à la croisée des chemins du mathématicien, de l’informaticien et du statisticien.

    Ils sont les nouveaux héros de l’économie de l’information. Le cabinet Glassdoor a classé le data scientist parmi les 25 métiers les plus recherchés. Data scientist est un des titres les plus enviés du moment, comme une sorte d’idéal alliant à la fois l’intelligence et la créativité et des connaissances scientifiques de haut niveau. Ces profils restent rares et très demandés. Sur 4,4 millions d’emplois proposés pour eux en 2015, seulement 40 % ont été pourvus. En France, pour la même année, c’est la moitié des postes qui n’ont pas trouvé preneurs. Ce manque pourrait même s’accentuer quand on sait que seules 20 % des entreprises utilisent les outils sur lesquels travaillent les data scientists. En 2018, il est estimé qu’il manque entre 140 000 et 190 000 spécialistes des données rien que pour les États-Unis.

    En outre, le salaire des data scientists est lui aussi d’un niveau élevé. En France, il se situe 35 000 euros en début de carrière et monte à 65 000 euros avec 5 ans d’expérience, à quoi s’ajoute près de 10 % de rémunération variable selon les entreprises et le secteur d’activité.

    Bien qu’il soit intéressant de s’interroger sur la nécessité de recruter ce type de profil pour son entreprise, il n’est pas fondamental de maîtriser à la perfection les langages Python ou Hadoop pour réussir à exploiter ses données. Cela peut s’avérer parfois simple, comme identifier les comportements ou évènements qui montrent qu’un nouvel utilisateur devient un utilisateur à long terme, ou plus compliqué. Par exemple des informaticiens non data scientists ont trouvé qu’avoir au moins dix amis sur Facebook est une garantie qu’un utilisateur va rester actif sur le site. C’est pourquoi le réseau social développe autant de fonctionnalités pour permettre de trouver de nouveaux amis.

    Trouver des alternatives

    Pour faire, dans une certaine mesure, de la data science sans data scientist, il existe des outils suffisamment peu techniques et compréhensibles par des salariés non experts en analyse.

    Voici une sélection non exhaustive d’outils pour interpréter ses données massives. Il s’agit pour la plupart de solutions de datavisualisation ou dataviz. Pour rappel, la datavisualisation est l’étude, la science ou l’art de représenter des données de façon visuelle. C’est avec cette branche que l’on pourra tenter d’analyser des données variées et éparses pour les présenter à ses collaborateurs de manière plus accessible. Pour plus de clarté, nous avons séparé logiciels gratuits et payants. Les solutions gratuites souvent disponibles en open source permettent de s’initier à l’interprétation globale des données, mais leurs fonctions restent assez limitées. Les logiciels payants pourront quant à eux se révéler très efficaces pour les entreprises (à condition de connaître un minimum l’univers de la data), la plupart permettant de travailler en collaboration.

    Logiciels gratuits

    • Chart.js, une solution pour commencer

    Chart.js est une bibliothèque open source. Elle ne propose que six types de graphiques, mais se révèle comme un outil de data visualisation optimal pour les petits projets d’entreprise. Le logiciel repose sur le HTML 5 pour la création de graphiques, et permet de créer des visuels en « responsive » et très esthétiques. Cet outil compte déjà parmi les plus populaires dans le domaine de la data visualisation. Chart.js est disponible en mode open source sous la licence MIT.

    • Dygraphs, un outil de data visualisation personnalisable

    Dygraphs est un outil open source reposant sur une bibliothèque de graphiques JavaScript permettant aux utilisateurs d’explorer et d’interpréter des ensembles de données denses et complexes. Ce logiciel gratuit est totalement personnalisable, compatible avec les principaux navigateurs, et optimisé pour les appareils mobiles.

    • Datawrapper, le plus simple d’utilisation

    Datawrapper est un logiciel simple d’utilisation et gratuit. Aucune installation n’est requise. Pas besoin non plus d’avoir des notions de codage pour pouvoir l’utiliser. Il suffit de copier simplement vos données depuis Excel ou Google Sheets. Vous pouvez également télécharger des fichiers CSV ou créer un lien vers une URL pour la mise à jour en temps réel des graphiques. Ensuite, il vous suffit de sélectionner le type de graphique que vous souhaitez obtenir. Par ailleurs, il est possible de personnaliser et d’annoter vos créations.  De nombreuses autres fonctions sont disponibles comme publier sur un site internet le graphique ou le télécharger sous format JPEG ou PDF.

    • Leaflet, un outil pour les données d’OpenStreetMap

    Leaflet est un outil de cartographie permettant d’utiliser facilement les données d’OpenStreetMap et d’intégrer des dataviz interactives en HTML5 ou CSS3. La bibliothèque de base est très limitée, mais les nombreux plug-ins disponibles permettent d’étendre les fonctionnalités avec des marqueurs animés, des masques ou encore des zones de chaleur. Cet outil gratuit disponible en open source est parfait pour les projets nécessitant de superposer des données sur une projection géographique.

    Logiciels payants

    • DataHero, un outil basé sur le cloud

    Avec DataHero, il est possible de rassembler des données en provenance de différents services cloud (Dropbox, Google Drive, Azure, AWS...) afin de créer des graphiques et des tableaux de bord. Aucune compétence technique n’est nécessaire, ce qui rend cet outil très pratique pour le travail d’équipe avec des personnes non spécialisées. Le prix d’une solution pour les entreprises débute à 500 euros.

    • Tableau, un logiciel intuitif

    Tableau est une solution de data visualisation très populaire. Elle permet de créer des graphiques, des infographies ou encore des cartes. Les utilisateurs peuvent très facilement transférer les données grâce à un système de glisser-déposer intuitif et confortable. Les graphiques se mettent à jour en temps réel, et il est possible de collaborer avec d’autres utilisateurs. L’abonnement proposé pour les entreprises commence à 60 euros par mois.

    • InstantAtlas, dédié à la cartographie

    InstantAtlas est un outil de data visualisation avec une fonctionnalité de cartographie. L’utilisateur peut créer des graphiques interactifs dynamiques et des visuels combinant statistiques et cartes pour des dataviz engageantes et claires. Les abonnements partent de 1 295 euros par an.

    • WolframAlpha, un outil de data visualisation pour les données ouvertes

    WolframAlpha est présenté comme un moteur de recherche et connaissance. Il permet de disposer des graphiques intelligemment pour répondre à des requêtes de données sans avoir besoin d’une configuration. Il est possible d’utiliser des open data pour créer des visualisations en toute simplicité à intégrer à un site web. Pour les professionnels, un abonnement est disponible à partir de 8,50 euros par mois.

    Devenez citizen data scientist

    Le manque de profils qualifiés dans la science des données a fait émerger une nouvelle étiquette : les citizen data scientists. Ce concept a été lancé en 2015 par le cabinet Gartner. Un citizen data scientist est une personne de l’entreprise qui construit des modèles utilisant des techniques analytiques avancées, ou des fonctionnalités prédictives ou descriptives, mais dont la fonction initiale se situe en dehors du domaine des statistiques et de l’analyse. En clair, un citizen data scientist est un collaborateur qui, avec un minimum de connaissances spécialisées, réussira à interpréter des données issues du big data pour les expliquer aux équipes concernées. Le citizen data scientist n’est pas un statisticien et il n’est pas non plus un expert de la donnée ; il est en réalité nous tous.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Archimag-320
    Nouvelle stratégie, réforme, réorganisation, choix économique, digitalisation… Les raisons d’une mutualisation ou d’une fusion de centres de documentation peuvent avoir diverses origines.
    Acheter ce numéro  ou  Abonnez-vous
    Les podcasts d'Archimag
    Rencontre avec Stéphane Roder, le fondateur du cabinet AI Builders, spécialisé dans le conseil en intelligence artificielle. Également professeur à l’Essec, il est aussi l’auteur de l’ouvrage "Guide pratique de l’intelligence artificielle dans l’entreprise" (Éditions Eyrolles). Pour lui, "l’intelligence artificielle apparaît comme une révolution pour l’industrie au même titre que l’a été l’électricité après la vapeur".

    Serda_Catalogue_general_des_formations_2025

    Baromètre emploi

    baromètre bloc.png

    Les derniers CV

    GED; SAE;

    Bonjour,


    Architecte


    Formation professionnelle - Ingénierie pédagogique - Innovation pédagogique - Banque et assurance - Création de contenus multimédias - Partenariats académiques - Transformation digitale - Consultant en formation

    Je suis Florent Siegenthaler, fondateur d’INSURACTIO, une entreprise dédiée à la transformation de la formation professionnelle. Fort de plus de 15 ans d’expérience dans les secteurs de la banque et de l’assurance, j’ai collaboré avec de grandes institutions académiques telles que L’École Supérieure de la Banque (CFPB), l’Université Paris-Est Créteil (UPEC), et la Faculté de Droit de l’Institut Catholique de Lille. Ces partenariats m’ont permis de développer des programmes pédagogiques innovants qui répondent aux exigences élevées de ces établissements.

     


    Documentaliste-Archiviste

    Mon parcours professionnel s'articule autour de la gestion du document de sa création à sa dimension historique.


    Assistante de conservation / archiviste

    Diplômée d'un master Patrimoines et Cultures Numériques, je m'intéresse à la conservation du patrimoine et à sa valorisation, notamment par le numérique.

    Mes différents stages en traitement de fonds d'archives ont conforté mon choix de travailler auprès de collections et de fonds patrimoniaux. Aujourd'hui, je cherche à diversifier mes expériences afin d'acquérir des compétences nécessaires pour ma future orientation professionnelle.