Par George Dearing
Nous sommes devenus des fous des données. Lacs de données, données obscures, scientifiques de données… Tout ce qui nous aide à faire apparaître les connaissances provenant de l’information que nous possédons est de taille conséquente. Il existe toutefois de nombreux défis organisationnels à prendre en compte. Ceux-ci vont de l’ensemble des compétences et l’ensemble des outils aux budgets et aux configurations. Pour en discuter, regardons quelques options de déploiement de mégadonnées, et ce qui motive les entreprises dans leurs choix.
Les options de déploiement de mégadonnées sont censées vous donner de la flexibilité. Elles ne devraient pas vous mettre des bâtons dans les roues à cause de la technologie ou d’outils privés.

 

Le passage des lacs de données aux plateformes en temps réel

Nous avons évoqué les lacs de données et les avantages de l’uniformisation des données. Les centres de données, comme on les appelle parfois, gagnent du terrain au fur et à mesure que les entreprises créent des preuves de concept (POC) et des petits déploiements avec Hadoop – un cadre de travail libre pour le traitement distribué à travers des groupes d’ordinateurs.

 

Le nuage sur site par rapport au nuage public

L’informatique en nuage a bouleversé l’entièreté de la technologie informatique, et elle bouleverse actuellement les approches de déploiement de mégadonnées. Désormais, les organismes ne peuvent plus prendre pour acquis que les infrastructures comme services ou les plateformes comme services sont les meilleures options qu’ils ont. Des choix plus discrets sont en train d’émerger, tels que les mégadonnées comme services, Hadoop comme service, ou même les bases de données comme services. Ces options aident les entreprises à éviter la stratégie « une seule solution pour tout ». Évidemment, cela signifie que les modèles de gouvernance et de sécurité doivent également être réévalués, surtout si les nuages hybrides et privés sont mélangés ensemble.

 

Les autres éléments qui sont actuellement en train d’être déplacés vers le nuage sont les analyses. Celles-ci représentent de bonnes premières candidates pour ce changement, car beaucoup de fournisseurs de niche possèdent des applications d’exploration de données et peuvent utiliser le nuage pour traiter de grandes quantités de données, ce qui soulage la charge de travail des services TI.

 

Le logiciel libre par rapport au logiciel exclusif

Les options de déploiement de mégadonnées sont censées vous donner de la flexibilité. Elles ne devraient pas vous mettre des bâtons dans les roues à cause de la technologie ou d’outils privés. Le fait d’associer plusieurs parties de la pile technologique aide à mieux conceptualiser le bon système pour une entreprise. C’est ici que les arguments établis dans ce but par rapport à ceux établis pour les produits de base entrent en jeu, et que la plupart des discussions sur le logiciel libre commencent. Hadoop d’Apache, MongoDB, Cassandra ainsi que plusieurs autres programmes sont, la plupart du temps, les points de départ des capacités principales. Des fonctions plus sophistiquées sont ajoutées plus tard par des fournisseurs ou des applications complémentaires.

 

Cela ne signifie pas que les grosses entreprises ne déploient pas tous leurs projets uniquement comme logiciels libres, mais il est plus facile d’atténuer les risques lorsque vos projets de mégadonnées sont petits et ont peu d’utilisateurs. C’est au fur et à mesure que vos projets prennent de l’ampleur que vous pourrez bénéficier pleinement de vos partenariats avec des fournisseurs de confiance. Outre les preuves de concept, il existe de nombreux intégrateurs de logiciels libres qui peuvent vous aider à atteindre vos objectifs. Ce n’est pas si différent de l’écosystème qui a vu le jour après l’essor de la gestion de contenu d’entreprise (GCE).

 

Les produits de base par rapport aux infrastructures sur mesure

La plupart des fournisseurs d’équipement informatique vendent à la fois des systèmes de base et des systèmes sur mesure pour les mégadonnées. Le supplément de prix survient quand vous vous procurez des systèmes standards, qui incluent l’intégration et le soutien intégré.

 

Bien qu’Hadoop et certaines bases de données de meilleure qualité fournissent en effet une plus grande extensibilité à l’aide de serveurs de base qui gèrent les charges de travail distribuées, il est important que vous restiez concentré sur les véritables besoins de votre entreprise et vos dossiers d’utilisation de mégadonnées. Certaines applications peuvent nécessiter plus de puissance de traitement, plus de mémoire ou plus de stockage SSD. Les profils de matériel peuvent également varier, certains nécessitant plus d’administration et de maintenance que d’autres. Et, une fois de plus, la complexité de votre objectif devrait orienter une grande partie de vos décisions. Si un appareil prêt à l’emploi offre une intégration préconçue et des fonctionnalités plus avancées, il y a de grandes chances que le coût total de propriété diminue à mesure que vos compétences augmenteront.

 

Conclusion sur le déploiement de mégadonnées

Consacrez du temps à l’évaluation de toutes vos options et communiquez avec d’autres entreprises qui ont créé des prototypes de mégadonnées. Renseignez-vous sur la façon dont elles ont combiné les technologies et les plateformes pour créer de la valeur. Vous comprendrez qu’il n’existe pas de règles du jeu.

 

Envisagez toutes les options.
Vous souhaitez déployer vos propres mégadonnées? Nos experts TI peuvent vous aider. Plus d’informations.