Repenser le cycle de vie de la donnée

Reconsidérer le cycle de vie de la donnée pour maîtriser l'explosion du volume de stockage

Xavier laignel - Expert BPO et BPM
Xavier laignel - Expert BPO et BPM

« Les entreprises voient leur volume de données exploser chaque année. 80 % de ce volume concerne aujourd'hui des données non structurées. Il y a toujours une sous-utilisation ou une faible optimisation du stockage dans l'entreprise. Les espaces disques sont sous-exploités avec un taux d'occupation inférieur à 50 % dans certains cas. Il faut revenir à une discipline accrue concernant la gestion du stockage, à savoir reconsidérer le cycle de vie de la donnée », résume Vincent Videlaine, directeur EMEA Strategic Alliances et Services Providers chez Symantec. En effet, aujourd'hui, une majorité d'entreprises, des PME et des grands comptes sont toujours dans cette phase d'ajouter des baies supplémentaires dans leur réseau de stockage ou dans leur datacenter plutôt que de déployer des outils nécessaires pour optimiser et mieux gérer leurs données surtout celles qualifiées de « non structurées ».

 

Il faut dire qu'à leur décharge, le coût moyen du Go est passé de 100 $ en 1996 à moins d'un demi-dollar aujourd'hui. À ce prix, on comprend mieux l'aisance des entreprises de rajouter des équipements supplémentaires. Résultat : on assiste à un paradoxe, car malgré la baisse du prix au Go, le stockage demeure l'un des postes les plus coûteux dans une infrastructure IT. La raison est que les habitudes de conservation des données et la croissance incessante des volumes ne cessent de remplir toutes ces baies (qui plus est, sont très hétérogènes). Cela accentue la complexité de la gestion du stockage. Selon une étude (State of the Data Center ou l'état des lieux sur la complexité des datacenters) menée par Symantec, 67 % des entreprises souhaitent réduire les coûts de la gestion et du stockage des données.

 

Suppression de la donnée : un critère devenu non essentiel dans le cycle de vie des données ?

Reconsidérer le cycle de vie de la donnée apparaît donc comme la problématique principale face à cette explosion du volume de stockage. « Effectivement dans la vie d'une donnée, il y a plusieurs étapes dont théoriquement celle de sa suppression, le système d'information doit donc pouvoir supprimer les données non pertinentes... », indique Cyril Van Agt, responsable avant-vente partenaires chez NetApp France. Mais quelles sont les entreprises qui suppriment vraiment leurs données, qu'elles soient pertinentes, inutiles... ou qui donnent un sens au cycle de vie de la donnée ? « Bien sûr dans tout environnement, il y a des données provisoires qu'il est préférable d'éliminer, ce sont ces fameuses données tampons, il faut conserver uniquement les données brutes. Prenons l'exemple de l'ADN humain, la conservation de ses données brutes a permis de le séquencer, d'autres exemples sont parlants dans le domaine de la télévision où l'on consulte des données vieilles de 30, 40, 50 ans et plus pour monter des reportages... », explique Gabriel Chaher, vice-président marketing EMEA et APAC de Quantum. Pour Jean Baptiste Ceccaldi, associé fondateur de Sentelis, un cabinet de conseil en gouvernance et architecture de systèmes d'information, c'est très difficile de supprimer les données quand on n'a pas une réelle gouvernance.


« La tendance est, et sera, de plus en plus à la conservation des données, car celles-ci ont potentiellement une valeur à long terme, il est donc de plus en plus difficile d'évoquer le cycle de vie d'une donnée... », justifie, pour sa part, Guy Chesnot, architecte stockage chez SGI. Ce dernier met d'ailleurs en avant l'exemple de la vidéosurveillance à Londres qui capte et produit énormément de données qui serviront aussi peut-être plus tard à mieux organiser le trafic. Pour François Remy Monnier, directeur des ventes pour l'Europe du Sud et l'Afrique de la division d'entreprise de Nec, le fait de se bloquer sur la suppression de la donnée n'a plus de sens, le focus doit être clairement mis sur la façon dont l'entreprise gère ses données avec le déploiement de solutions logicielles adaptées. Sébastien Verger, directeur technique d'EMC France estime, de son côté, que la suppression de la donnée reste un élément important dans le cycle de vie d'une donnée. Le directeur technique n'hésite d'ailleurs pas à prendre un exemple de déploiement interne à EMC, « pour faire face à l'explosion des mails, EMC a mis en place un processus d'archivage automatique des messages. Ainsi, au bout de trois mois, les mails sont automatiquement archivés et au bout de 7 ans, ils sont supprimés. La suppression, mais aussi l'archivage ultime font intégralement partie du cycle de vie d'une donnée à condition d'avoir des méthodologies ou des outils de gouvernance. » Enfin, pour Luc D'Urso, PDG de Wooxo, une société française spécialisée dans les solutions de protection et de partage sécurisé du patrimoine numérique professionnel pour la cible TPE et PME, il est, pour des raisons économiques, nécessaire de se fixer des règles et un calendrier précis sur la durée de rétention des fichiers, surtout pour la cible PME.

 

Retrouvez l'intégralité du dossier sur LMI LeMonde Informatique :