Au service du Big Data

12

Sep, 17

Au service du Big Data

Want create site? Find Free WordPress Themes and plugins.

Le Big Data s’impose dans notre quotidien. Ainsi, en 2016, ce sont près de 2,5 quintillions (1030) de données qui ont été créées chaque jour. Un chiffre quasi inconcevable, qui représente 90 % des données existantes créées au cours des deux dernières années ! Cela nous donne un petit aperçu des enjeux relatifs aux capacités de traitement nécessaires pour les analyser et les stocker. Une tendance loin de s’inverser, puisque le flux de données devrait atteindre les 50 000 Go/seconde en 2018, alors qu’il était de 28 875 Go/s en 2013…

D’où viennent ces données ?
Ces données créées à partir des applications présentes sur nos smartphones ou depuis des sites Internet, des réseaux sociaux, des applications métier (santé, transport, commerce, industrie, etc.) et des objets connectés sont de plus en plus utiles. Grâce à elles, on peut désormais prédire la météo des jours à venir avec précision, suivre l’évolution de santé d’un patient ou encore améliorer les placements boursiers. Mais le Big Data pose de véritables défis : comment gérer cette quantité astronomique de données, la stocker et l’analyser, sans mettre en péril la protection de nos données personnelles ?

Le Big Data et le marché français
Convertir de grandes quantités de données en informations exploitables n’est donc pas une mince affaire. Et pour cause, peu d’infrastructures peuvent traiter autant de données à la seconde. La réponse se trouve dans le Cloud Computing qui permet de disposer de la capacité de stockage du Cloud avec ses Datacenters et de la puissance de calcul de serveurs distants.
Toutefois, malgré l’arrivée en masse de cette solution, peu nombreuses sont les entreprises françaises à l’utiliser. Ainsi, selon une étude de l’Insee, seules 17% des sociétés de plus de 10 personnes achètent ce type de service. Cependant, le marché a progressé de 5 points par rapport à 2012.
Ce sont bien entendu les entreprises les plus conséquentes qui utilisent majoritairement le Cloud Computing. Ainsi, 48 % des entreprises de 250 salariés et plus utilisent ces services, 21 % pour les entreprises de 20 à 249 personnes, et 13% pour les TPE de 10 et 19 salariés.

Que faire de ces données ?
Du côté de la répartition, le Big Data est principalement présent dans le secteur des transports, de l’information et de la communication. Il n’est donc pas étonnant de retrouver de grande quantité de données liées à la géolocalisation, issues des réseaux sociaux et provenant, bien sûr, des objets connectés ou capteurs. La majorité des entreprises réalisent ces analyses de données (Big Data) afin d’optimiser les processus de production internes ou de fournir du service, tel que l’info trafic qui découle d’une analyse des données de géolocalisation. Le marketing et la gestion des ventes utilisent quant à eux les données provenant des médias sociaux pour renforcer leur discours et leur approche.

Comment les traiter ?
L’analyse de ces données, structurées ou non, est, dans la majorité des cas, réalisée par des prestataires externes (à l’exception des marchés de l’information-communication, qui utilisent des données souvent sensibles et spécifiques). Elle permet de prendre les décisions appropriées et d’adapter plus rapidement les produits, services et processus aux exigences du marché.

Pourquoi le Cloud ?
Grâce à sa montée en charge potentiellement infinie, le Cloud est l’une des meilleures solutions pour les projets de Big Data. Outre sa souplesse, le Cloud offre aux entreprises la possibilité de tester de nouveaux modèles analytiques sans avoir besoin de disposer de nombreuses machines virtuelles ou de compétences. Ils peuvent ainsi passer sur une Platform as a Service (Paas), disponible immédiatement. Une fois le modèle validé, il est très simple de passer à l’échelle industrielle en s’appuyant sur la capacité de dimensionnement dynamique des plateformes de cloud public. Pour les plus grosses quantités de données, on peut directement utiliser un Big Data as a service (BDaaS).

Disponible chez Amazon Web Services avec Elastic MapReduce (EMR) ou Microsoft avec Azure HDInsight, ces services d’analyse de mégadonnées reposent sur des modules de stockage du cloud. Ces offres pourraient être requalifiées de « Hadoop as a service » puisqu’elles intègrent le framework open source ainsi que de nombreux outils associés qui offrent la possibilité d’extraire, transformer et charger des données tout en s’assurant d’appliquer traitement analytique. Enfin, la facturation peut s’effectuer à la minute ou à l’heure en fonction des fournisseurs de service. Ces modes de tarification peuvent se révéler très compétitifs pour des usages ponctuels afin de faire face à un pic de traitement.

Did you find apk for android? You can find new Free Android Games and apps.
COLOR SCHEME Unlimited color options are avaliable via Options Panel.