Tonian Systems (www.tonian.com), éditeur israélien de stockage, continue à se découvrir peu à peu. J'avais couvert la société en Novembre 2011 après son second tour de financement mais rien ne filtrait et c'est toujours un peu pareil sauf que le site existe et qu'il confirme le gros travail sur pNFS depuis la version 4.0 de NFS, aujourd'hui associé à la version 4.1 et suivantes.
Revenons sur pNFS car sa compréhension semble floue sur le marché ou chez certains vendeurs. pNFS est l'acronyme de Parallel NFS et constitue la tentative de normalisation des accès et systèmes de fichiers parallèles. Plusieurs approches existent sur le marché en dehors de cette initiative, on peut citer PVFS ou Lustre par exemple. L'esprit de pNFS est asymétrique avec au moins un serveur de meta data dit MDS et plusieurs serveurs de données. Le coté parallèlisme est clé ici puisque son sens est donné par le striping des fichiers entre les serveurs de données. Un fichier n'appartient plus à un serveur simplement comme cela se fait avec un "classique" serveur NFS. L'autre point de vue est qu'il ne s'agit pas de considérer plusieurs serveurs pour des données différentes mais bien d'intégrer le caractère parallèle du stockage et de l'accès aux données. On comprend ensuite pourquoi les débits sont importants. L'exemple suivant parle de lui-même: soit un fichier de 10 blocs, chacun stocké sur un serveur parmi un pool de 10 serveurs. L'accès au fichier complet se fait globalement sur le temps de service du premier bloc avec le rapatriement donc des 10 en parallèle sans avoir besoin d'attendre le traitement des 9 suivants s'ils étaient servis en séquence depuis un seul serveur NFS. Le temps est environ équivalent à 1/10 du temps séquentiel. pNFS propose un MDS qui peut être séparé mais nous pouvons envisager un MDS par serveur de données, l'esprit restant asymétrique, le client ne sachant pas où se trouve la donnée. Les serveurs de données peuvent être de 3 natures différentes: object au sens OSD (SCSI T10), fichiers avec des NAS ou Bloc avec des unités de disques.
Alors pourquoi pNFS ? simplement car toutes les autres approches sont propriétaires et l'industrie a besoin de normalisation pour favoriser une adoption massive et ainsi baisser les coûts. Plusieurs tentatives propriétaires existent mais elles se heurtent au design même de NFS. Prenons Isilon, même s'il y a plusieurs têtes NAS, NFS par exemple, et que les données sont ensuite éclatées, un seul serveur NFS sert la même donnée. Bien sûr, plusieurs serveurs peuvent servir la même donnée en parallèle mais de façon complète, c'est-à-dire le fichier en entier depuis le même serveur. Le striping des données existent bien mais les serveurs ne contribuent pas de façon simultanée au service. Une autre vue est celle côté client. Pour les serveurs classiques, la couche client NFS n'est pas changée et reçoit donc qu'un seul stream qui constitue le fichier. Pour pNFS, le client NFS v4.1 a la capacité de parler à plusieurs serveurs et d'agréger les donnée reçues. Le travail est donc aussi effectué par le client mais attention, tout ça se fait plus vite que le stream depuis un seul serveur. On espère donc que pNFS deviendra le standard attendu et tiendra ses promesses et qu'il mettra tous les acteurs sur la même ligne, la différence venant d'ailleurs.
Nous attendons donc avec impatience l'angle de la solution Tonian.
4 commentaires:
Panasas est aussi une belle solution sur ce type de stockage parallèle.
Pas un petit mot sur l'offre Panasas qui pourtant fonctionne sur ce principe ?
Bien sûr, vous avez raison, c'est pourquoi j'avais mentionné Panasas quand j'avais évoqué Tonian en Novembre 2011 car Benny Havely, le CTO de Tonian, était chez Panasas. J'ai prévu un post sur pNFS plus global d'ici qq semaines donc sera couvert Panasas entre autres. Merci de votre commentaire.
et j'ajouterai que Panasas est une super solution pNFS probablement la plus aboutie d'ailleurs car l'acteur qui y a cru le plus aussi et assez tôt.
Post a Comment