Article réservé aux abonnés Archimag.com

Comment s'approprier le big data quand on n'est pas data scientist ?

  • citizen_datascientist.jpg

    data-scientist
    Seulement 20 % des entreprises utilisent les outils sur lesquels travaillent les data scientists. (Freepik/Rawpixel)
  • La data science ou science des données est un domaine technique difficile à gérer pour un grand nombre d’entreprises et recruter un data scientist, profil très recherché, mais également très coûteux, n’est pas à la portée de toutes. Heureusement, pour parvenir à interpréter des données si prometteuses, les outils se démocratisent.

    Près de 75 % des entreprises comptent implémenter l’intelligence artificielle et le big data d’ici 2020. C’est ce que révèle un sondage mené par le magazine The Economist auprès de plus de 200 responsables d’entreprise.

    La question d’exploiter ces données massives devient donc primordiale pour les entreprises de toutes tailles afin de rester compétitives.

    Nouveaux héros

    Qualifié de « job le plus sexy du XXIe siècle » par la Harvard Business Review (une revue américaine sur le monde de l’entreprise), le data scientist donne du sens aux données recueillies de sources diverses. Les compétences du data scientist se situent à la croisée des chemins du mathématicien, de l’informaticien et du statisticien.

    Ils sont les nouveaux héros de l’économie de l’information. Le cabinet Glassdoor a classé le data scientist parmi les 25 métiers les plus recherchés. Data scientist est un des titres les plus enviés du moment, comme une sorte d’idéal alliant à la fois l’intelligence et la créativité et des connaissances scientifiques de haut niveau. Ces profils restent rares et très demandés. Sur 4,4 millions d’emplois proposés pour eux en 2015, seulement 40 % ont été pourvus. En France, pour la même année, c’est la moitié des postes qui n’ont pas trouvé preneurs. Ce manque pourrait même s’accentuer quand on sait que seules 20 % des entreprises utilisent les outils sur lesquels travaillent les data scientists. En 2018, il est estimé qu’il manque entre 140 000 et 190 000 spécialistes des données rien que pour les États-Unis.

    En outre, le salaire des data scientists est lui aussi d’un niveau élevé. En France, il se situe 35 000 euros en début de carrière et monte à 65 000 euros avec 5 ans d’expérience, à quoi s’ajoute près de 10 % de rémunération variable selon les entreprises et le secteur d’activité.

    Bien qu’il soit intéressant de s’interroger sur la nécessité de recruter ce type de profil pour son entreprise, il n’est pas fondamental de maîtriser à la perfection les langages Python ou Hadoop pour réussir à exploiter ses données. Cela peut s’avérer parfois simple, comme identifier les comportements ou évènements qui montrent qu’un nouvel utilisateur devient un utilisateur à long terme, ou plus compliqué. Par exemple des informaticiens non data scientists ont trouvé qu’avoir au moins dix amis sur Facebook est une garantie qu’un utilisateur va rester actif sur le site. C’est pourquoi le réseau social développe autant de fonctionnalités pour permettre de trouver de nouveaux amis.

    Trouver des alternatives

    Pour faire, dans une certaine mesure, de la data science sans data scientist, il existe des outils suffisamment peu techniques et compréhensibles par des salariés non experts en analyse.

    Voici une sélection non exhaustive d’outils pour interpréter ses données massives. Il s’agit pour la plupart de solutions de datavisualisation ou dataviz. Pour rappel, la datavisualisation est l’étude, la science ou l’art de représenter des données de façon visuelle. C’est avec cette branche que l’on pourra tenter d’analyser des données variées et éparses pour les présenter à ses collaborateurs de manière plus accessible. Pour plus de clarté, nous avons séparé logiciels gratuits et payants. Les solutions gratuites souvent disponibles en open source permettent de s’initier à l’interprétation globale des données, mais leurs fonctions restent assez limitées. Les logiciels payants pourront quant à eux se révéler très efficaces pour les entreprises (à condition de connaître un minimum l’univers de la data), la plupart permettant de travailler en collaboration.

    Logiciels gratuits

    • Chart.js, une solution pour commencer

    Chart.js est une bibliothèque open source. Elle ne propose que six types de graphiques, mais se révèle comme un outil de data visualisation optimal pour les petits projets d’entreprise. Le logiciel repose sur le HTML 5 pour la création de graphiques, et permet de créer des visuels en « responsive » et très esthétiques. Cet outil compte déjà parmi les plus populaires dans le domaine de la data visualisation. Chart.js est disponible en mode open source sous la licence MIT.

    • Dygraphs, un outil de data visualisation personnalisable

    Dygraphs est un outil open source reposant sur une bibliothèque de graphiques JavaScript permettant aux utilisateurs d’explorer et d’interpréter des ensembles de données denses et complexes. Ce logiciel gratuit est totalement personnalisable, compatible avec les principaux navigateurs, et optimisé pour les appareils mobiles.

    • Datawrapper, le plus simple d’utilisation

    Datawrapper est un logiciel simple d’utilisation et gratuit. Aucune installation n’est requise. Pas besoin non plus d’avoir des notions de codage pour pouvoir l’utiliser. Il suffit de copier simplement vos données depuis Excel ou Google Sheets. Vous pouvez également télécharger des fichiers CSV ou créer un lien vers une URL pour la mise à jour en temps réel des graphiques. Ensuite, il vous suffit de sélectionner le type de graphique que vous souhaitez obtenir. Par ailleurs, il est possible de personnaliser et d’annoter vos créations.  De nombreuses autres fonctions sont disponibles comme publier sur un site internet le graphique ou le télécharger sous format JPEG ou PDF.

    • Leaflet, un outil pour les données d’OpenStreetMap

    Leaflet est un outil de cartographie permettant d’utiliser facilement les données d’OpenStreetMap et d’intégrer des dataviz interactives en HTML5 ou CSS3. La bibliothèque de base est très limitée, mais les nombreux plug-ins disponibles permettent d’étendre les fonctionnalités avec des marqueurs animés, des masques ou encore des zones de chaleur. Cet outil gratuit disponible en open source est parfait pour les projets nécessitant de superposer des données sur une projection géographique.

    Logiciels payants

    • DataHero, un outil basé sur le cloud

    Avec DataHero, il est possible de rassembler des données en provenance de différents services cloud (Dropbox, Google Drive, Azure, AWS...) afin de créer des graphiques et des tableaux de bord. Aucune compétence technique n’est nécessaire, ce qui rend cet outil très pratique pour le travail d’équipe avec des personnes non spécialisées. Le prix d’une solution pour les entreprises débute à 500 euros.

    • Tableau, un logiciel intuitif

    Tableau est une solution de data visualisation très populaire. Elle permet de créer des graphiques, des infographies ou encore des cartes. Les utilisateurs peuvent très facilement transférer les données grâce à un système de glisser-déposer intuitif et confortable. Les graphiques se mettent à jour en temps réel, et il est possible de collaborer avec d’autres utilisateurs. L’abonnement proposé pour les entreprises commence à 60 euros par mois.

    • InstantAtlas, dédié à la cartographie

    InstantAtlas est un outil de data visualisation avec une fonctionnalité de cartographie. L’utilisateur peut créer des graphiques interactifs dynamiques et des visuels combinant statistiques et cartes pour des dataviz engageantes et claires. Les abonnements partent de 1 295 euros par an.

    • WolframAlpha, un outil de data visualisation pour les données ouvertes

    WolframAlpha est présenté comme un moteur de recherche et connaissance. Il permet de disposer des graphiques intelligemment pour répondre à des requêtes de données sans avoir besoin d’une configuration. Il est possible d’utiliser des open data pour créer des visualisations en toute simplicité à intégrer à un site web. Pour les professionnels, un abonnement est disponible à partir de 8,50 euros par mois.

    Devenez citizen data scientist

    Le manque de profils qualifiés dans la science des données a fait émerger une nouvelle étiquette : les citizen data scientists. Ce concept a été lancé en 2015 par le cabinet Gartner. Un citizen data scientist est une personne de l’entreprise qui construit des modèles utilisant des techniques analytiques avancées, ou des fonctionnalités prédictives ou descriptives, mais dont la fonction initiale se situe en dehors du domaine des statistiques et de l’analyse. En clair, un citizen data scientist est un collaborateur qui, avec un minimum de connaissances spécialisées, réussira à interpréter des données issues du big data pour les expliquer aux équipes concernées. Le citizen data scientist n’est pas un statisticien et il n’est pas non plus un expert de la donnée ; il est en réalité nous tous.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Archimag-320
    Nouvelle stratégie, réforme, réorganisation, choix économique, digitalisation… Les raisons d’une mutualisation ou d’une fusion de centres de documentation peuvent avoir diverses origines.
    Acheter ce numéro  ou  Abonnez-vous
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    Baromètre emploi

    baromètre bloc.png

    Les derniers CV

    Documentaliste

    Professionnel de l'information avec 7 ans d'expérience


    Archiviste - documentaliste

    Jeune archiviste, passionné d'histoire, d'art et de littérature. J'ai un peu plus de deux ans d'expériences en archivage et recherche poste en archives, en documentation ou encore en bibliothèques.


    Archiviste

    Bonjour,


    archeologue

    CV TOUFIK ZAABAR


    Gestion de l'information et de la documentation

    Madame, Monsieur,

    Actuellement en fin d'études, et en recherche d'un premier emploi après la fin de cesdernières, je me permets de vous soumettre ma candidature.

    Formé à la gestion et à la rédaction de documents, à la vulgarisation scientifique,ainsi qu'à la gestion d'archives et de bibliothèques, je suis particulièrement motivépour rejoindre vos organisations.