Je disais donc… les données, les compagnies en recueillent beaucoup sur nous, souvent pour essayer de faire plus d’argent sur notre dos. Une banque offrira plus de crédit à un client qui a dépassé sa limite, un site Web proposera d’autres produits « intéressants » après un achat, un autre vendra vos renseignements personnels à des fins publicitaires. Ce n’est pas SI grave en soi, en autant d’en être bien conscients.
Mais les données, l’intelligence artificielle, l’apprentissage machine, ça peut aussi faire œuvre utile :
- Mieux gérer la consommation d’énergie (idéalement propre, et réduire la consommation des énergies sales), à petite et à grande échelles
- Optimiser les patterns de déplacement, notamment pour les transports en commun
- Prédire les catastrophes naturelles
- Améliorer la santé publique (avec des moyens de dépistage précoce de maladies, des plans de traitement optimisés, une meilleure gestion des épidémies)
- Favoriser la recherche scientifique
- Déléguer aux machines des tâches aliénantes et possiblement créer des emplois plus stimulants
C’est quand même pas pire, et la liste n’est pas exhaustive. Mais ce ne sont pas nécessairement ces nobles poursuites qui font que c’est pertinent pour moi d’étudier la science des données. Après tout, dans mon emploi actuel, je participe à vendre davantage de crédit à des gens qui en ont déjà trop… et bien que ce ne soit pas spécialement motivant, ce n’est pas non plus le cœur du problème. En tout cas, ce n’est pas ce problème-là que je veux régler en premier. Mon objectif, à court/moyen terme, demeure de rester chez le même employeur.
Alors c’est quoi exactement, la science des données, et pourquoi ai-je envie de me lancer là-dedans? C’est souvent représenté comme le cœur d’un diagramme de Venn constitué de trois cercles : programmation, statistique et domaine de spécialité (le troisième cercle étant parfois plutôt étiqueté « résolution de problèmes »). En gros, il s’agit d’aller à la pêche dans l’océan des données et de faire parler les poissons!
L’essor de cette discipline et son étroite connexion avec l’informatique font en sorte qu’il y a énormément de ressources interactives en ligne pour apprendre ses fondements. Je ne cacherai pas que cela joue un rôle dans mon choix : je l’ai déjà dit (habituez-vous, je fais juste commencer à radoter…), je n’ai pas le luxe de prendre plusieurs années pour retourner sur les bancs d’école. Un apprentissage autodidacte (mais guidé) en ligne, qui me permet d’avancer à mon rythme (c’est-à-dire le rythme « j’ai un fusil sur la tempe parce que chaque semaine de congé sans solde me coûte XXX(X?) $, fait que je suis pas là pour niaiser »), qui ne coûte presque rien… En réalité, on pourrait presque dire que c’est ma seule option. À temps partiel, un simple certificat à l’université me prendrait 4 ou 5 ans… ça n’arrivera pas.
Mais le facteur clé, c’est que je suis une véritable nerd, depuis toujours, et que je trouve ça très ludique, voire addictif, la programmation! Vous me direz que je pourrais ne faire que ça, ce qui n’est pas faux… mais j’aime bien l’idée de mettre à profit d’autres compétences ou connaissances que j’ai déjà. Mon domaine de spécialité pourrait éventuellement être choisi parmi les choses que je connais ou que je sais faire. Pour des raisons pratiques, le domaine bancaire ou des assurances risque fort d’être ma porte d’entrée. Mais j’aime bien m’imaginer qu’en gagnant de l’expérience et en continuant d’apprendre sans relâche, cela pourrait me mener vers une sous-discipline de l’apprentissage machine qui serait vraiment dans mes cordes de passionnée des mots : le Natural Language Processing. (Je ne serais pas si loin de la recherche appliquée en linguistique informatique dont j’ai déjà parlé, bien que la route pour y parvenir soit tout autre. J’aime penser que ça se peut.)
Je vais avoir du gros travail à faire côté statistique; je ne pense pas que ce sera suffisant de savoir comment calculer une moyenne ou une médiane… Disons que je suis plus habituée à des arguments qualitatifs que quantitatifs… Et je dirais même que la plupart de mes arguments ne sont même pas qualitatifs, mais rhétoriques! Ça se pourrait que j’aie de la misère à convaincre des gens très rationnels et calculateurs avec des belles figures de style! Mais ça s’apprend, hein, compter des vraies choses, et ça ne me fait pas peur. J’envisagerai peut-être des moyens un peu plus traditionnels pour acquérir ces compétences : des cours, peut-être même de vulgaires livres!
Et dans tous les cas, pour faire parler les poissons, il faut savoir raconter une histoire. Je pense que je m’en viens bonne là-dedans, ça ne peut pas nuire. 🙂
Après, c’est bien beau de trouver que ça a l’air intéressant, mais une telle démarche exige quand même de vérifier quel genre d’emploi je pourrais espérer obtenir. Les plateformes d’apprentissage en ligne ont tôt fait de dire qu’« untel a obtenu un emploi d’analyste à 100 000 $ en 10 jours », ou des trucs du genre… Un minimum de scepticisme s’impose (je dois quand même avouer que j’ai grossièrement exagéré l’affirmation ci-dessus)! Mes recherches se poursuivent donc en ce sens, et je suis tombée hier sur deux articles très intéressants, dont je vous mets les liens ci-dessous, parce que ce billet est si sérieux que je cite mes sources :
Article de Global News sur les perspectives d’emploi en science des données
Analyse des possibilités d’emplois et des salaires, par l’Université du Wisconsin
Vous irez pas lire ça, c’est sûr… Je mets essentiellement les liens ici pour pouvoir y revenir moi-même. Je vais tout de même relever deux informations tout à fait contradictoires. Le premier article dit ceci : « Most data analyst have a university education in a quantitative field, but, with a bit of “hustling” it is possible to get the gig without a degree, according to Fraser. » Je ne sais pas si le terme « hustling » se prête bien à ma démarche, mais ça me donne quand même un peu d’espoir. Espoir qui a bien failli être détruit par le second article, qui dit ceci : « Data scientists tend to have advanced degrees in quantitative disciplines such as data science, applied mathematics, statistics, computer science, engineering, economics, or operations research. But only a data science master’s degree will give you the precise education you need to be ready for a career in data science. » En cliquant sur le lien, j’ai constaté que l’Université du Wisconsin essaie SUBTILEMENT de vendre son diplôme en ligne à 30 000 $US! Comme dirait Thierry L’Hermitte : « C’est c’la, oui… c’est c’la… »
Par ailleurs, j’ai trouvé très éclairante la « gradation » des emplois décrits dans l’article de Global. Essentiellement, un débutant dans le domaine analyse des données existantes, pour y déceler des tendances; l’étape suivante est d’élaborer des modèles prédictifs; et le summum, c’est d’entraîner l’intelligence artificielle pour qu’elle crée elle-même les modèles prédictifs. Mon résumé est forcément réducteur, mais ça me donne une idée de ce que je peux viser pour commencer (le bas de l’échelle!), tout en me montrant qu’il y a une échelle! Et c’est un domaine qui évolue! Possibilités infinies d’apprentissage!
C’était pas mal sérieux comme billet… mais néanmoins essentiel, plusieurs d’entre vous m’ayant questionnée pour savoir c’est quoi, la science des données. Le programme habituel de niaiseries sera bientôt de retour avec un nouvel épisode de La saga des mauvais choix!
J’ai tâté le début du commencement de l’introduction de cet immense et si intéressant domaine en me pitchant tête première dans le moteur de recherche CINAHL pour me conformer aux exigences de mon programme universitaire qui veut faire de moi une scientifique en bonne et due forme.
J’ai eu un délicieux vertige quand j’ai compris de quoi il s’agissait, et tout ce que ça sous-tendait.
Ce soir-là, Greg et moi avons eu la discussion suivante : «Non, Andréane, tu ne changes pas de domaine d’étude, ça suffit! »
C’était un monologue pour dire la vérité.
Parce que je savais bien que je n’avais ni la force ni le temps (je suis plus vieille que toi, hého!) de remettre en route d’autres séduisants apprentissages qui, me vissant les fesses sur les bancs d’école/biblio, ne me permettent pas une grosse contribution à l’épicerie, ou aux études…bientôt universitaires des enfants!!
Cette petite mise en contexte concise et limpide, à ton image, eh bien, elle ne sert qu’à introduire ceci:
Je te feel en t’ta.
Et je t’envie de ton courage, et de ta confiance en soi pour l’encadrement autodidacte.
Tu es stimulante et merveilleuse.
Bloque-moi quand tu veux, hein, je suis verbeuse… mais c’est de ta faute!! Tu touches TOUTES mes cordes sensibles.
xx
J’aimeJ’aime
Je te bloquerai jamais, ma commentatrice la plus enthousiaste! À vrai dire, j’aime plus dialoguer que monologuer, alors gâte-toi!
J’aimeJ’aime
J’aime beaucoup votre blog. Un plaisir de venir flâner sur vos pages. Une belle découverte et blog très intéressant. Je reviendrai m’y poser. N’hésitez pas à visiter mon univers. Au plaisir.
J’aimeJ’aime
Données… Assurances… Idéal de Véro… Pars une base de données sur les déplacements des gens en auto-solo; fais des liens pour créer des co-voitureurs et dis aux compagnies d’assurances d’offrir des rabais aux co-voitureurs dont l’auto ne sert qu’une semaine sur deux. Tu gagnerais sur toute la ligne; les compagnies d’assurances gagneraient sur toute la ligne; la société québécoise gagnerait sur toute la ligne !
J’aimeJ’aime
Techniquement, les primes d’assurance sont déjà fondées (en partie) sur le kilométrage, alors quelqu’un qui se sert de sa voiture une semaine sur deux devrait déjà payer un peu moins (mais je ne sais pas dans quelle mesure exactement). Mais oui, c’est sûr qu’il y a des choses à faire avec les données pour qu’on détruise moins la planète, et qu’à long terme, ça m’intéresse plus que vendre des cartes de crédit ou des gogosses. Mais là, j’ai tout un dilemme moral pour cet été… Si tout va bien et que je continue de prendre de l’avance dans ma formation, je devrais être capable de faire de l’aviron RÉGULIÈREMENT cet été. Est-ce que je vais à Laval à vélo, ou à Terrebonne en voiture?!?
J’aimeJ’aime