jeudi 25 août 2016

Qu'est-ce que le Big Data ?

"Big data" se traduit littéralement par "énormes données" ou "données massives".
Big data

L'accumulation toujours plus considérable de données a conduit à multiplier les moyens d'analyse et d'utilisation de ces données.

Mais cela a aussi changé la façon d'analyser et de voir.

Comment cela nous concerne ?
Comment sont utilisées nos données personnelles ?
Quels monstres de marketing et de publicité nous ciblent ?
Mais aussi qu'est-ce que cela peut nous apporter ?


Croissance des Big data (source Wikipédia)


Une quantité ahurissante de données "pompées" par tous les moyens.



  • 90% des données d'aujourd'hui ont été créées ces deux dernières années seulement !
  • 3 milliards d'individus ont accès à Internet,c'est-à-dire autant que la population mondiale de 1960.
  • en 2013, près de 29.000 Go sont générés chaque seconde et le volume double tous les deux ans.
  • mais 90% des données ne sont pas structurées (organisées) - mails, photos, documents commerciaux...
                                Source : LPTIWEB et VoucherCloud


Les 4 axes de la transformation numérique

Dans "la révolution des données", 4 axes sont les fondations de cette transformation,.
Interconnectés, ils s'alimentent l'un l'autre.
Ce sont :
  1. Mobile et Web. La fusion des mondes réel et virtuel.
  2. Cloud computing. Le Web comme plateforme ubiquitaire de services.
  3. Big Data. La révolution des données.
  4. Empowerment social. La redistribution des rôles.
Tous contribuent aux Big data

L'utilisation des données personnelles pour le ciblage commercial agace, inquiète et révolte.

Google traite chaque jour plus de 24 Pétaoctets de données.Facebook, 10 millions de nouvelles photos à l'heure.

YouTube charge plus d'une heure de nouvelles vidéos à la seconde.
Twitter double le nombre de ses messages chaque année (400 millions en 2012)

Dans le livre "Big data, la révolution des données est en marche", les auteurs citent l'exemple d'un magasin américain (Target) capable d'analyser par ses données d'achat, qu'une cliente est enceinte, prédire sa date d'accouchement, pour envoyer leurs félicitations et l'offre commerciale pour la première layette !

Mais d'une façon plus générale, ce livre se termine sur le risque d'une dictature des données et le questionnement indispensable sur la part de libre arbitre, à l'intuition, aux convictions et à la conscience des humains.

Ciblage des données personnelles

Mais d'autres utilisations scientifiques et techniques sont aussi impressionnantes et bénéfiques

  • prospectives : météorologiques, environnementales, climatiques
  • gestion des risques : industries, commerces, assurances, naturels
  • médecine : fonctionnement du corps, épidémiologie
  • les phénomènes sociaux, culturels...
et aussi :
  • les transports
  • les échanges commerciaux
  • le tourisme
  • les communications (analyse en direct des trafics)
  • les machines plus "intelligentes"


Refuser les Big data ? Est-ce possible ? est-ce souhaitable ?

Refuser les Big data ?
On se priverait en même temps des progrès qu'elles peuvent apporter.

Et il ne me semble pas possible de refuser des connaissances quelles qu’elles soient.
Même si la confidentialité pouvait être réellement respectée par certains, comment s'assurer que d'autres n'en profitent pas sans aucun contrôle ni retenue.

Il paraît plus raisonnable d'édicter et de se donner les moyens de faire appliquer des règles transparentes sur la collecte et l'utilisation des données.
Ces règles doivent respecter la vie personnelle de chacun et chacun doit pouvoir s'assurer de cela.

Le rôle de la CNIL (Commission Nationale Informatique et Libertés) et de ses organisations sœurs dans le monde est de protéger les données personnelles.
Mais il faut contrer la puissance des GAFA (voir mon article ;"Les grandes batailles, enjeux et acteurs dans la high-tech") et de leurs nombreux lobbyistes, cabinets d'avocats internationaux, experts financiers, groupes d'intérêts croisés dans tous les domaines.
Le combat est très déséquilibré.


Ce n'est malheureusement pas propre ni limité aux Big data !