Weka.io souhaite encore rester très discrète mais va bientôt sortir du mode silencieux dans lequel l’entreprise se développe depuis 2013. Elle a construit un système de fichiers assez révolutionnaire qui peut évoluer quasiment à l’infini sur les environnements Flash...
Si vous cherchez d’où vient le nom de l’entreprise, dites-vous qu’il peut se référer à un oiseau qui ne vole pas en Australie ou qu’il est la synthèse de « We kill them All », qui semble plus approprié à ce que souhaitent les fondateurs de Weka.IO.
L’entreprise américano-israélienne est présente à San José en Californie et à Tel-Aviv et a déjà levé 32M$ en deux tours de financement et des entreprises comme Qualcomm sont au capital. Le logiciel est déjà en production chez un client et 2 tests sont en cours dans 2 majors du secteur des médias et dans la recherche génomique.
Un système de fichiers optimisé Flash
La solution s’appuie sur du matériel standard et utilise Ethernet ou fibre Channel. Barbara Murphy, en charge du marketing, indique : « nous n‘avons pas besoin d’Infiniband pour atteindre les performances désirées ». Weka.IO a totalement repensé un système de fichiers pour répondre aux besoins actuels du stockage.
Les caractéristiques annoncées sont spectaculaires. 100 % logicielle, la solution, un système de fichiers optimisé pour les environnements Flash, permet des capacités de plusieurs dizaines de Petaoctets, de millions de fichiers avec des performances pouvant aller à plusieurs millions d’IOPS pour une latence inférieure à 300µsec (1 µsec = 1 millionième de seconde).
La solution se présente comme une application virtualisée dans un cluster de calcul où les données résident sur les disques SSD du cluster.
Les données « froides » sont automatiquement placées dans un cloud privé ou public. La solution a déjà des APIs pour Cleversafe, AWS S3, Scality et OpenStack.
Un déploiement simplifié
Techniquement, la solution se déploie facilement après quelques opérations. Tout d’abord choisir un serveur standard, allouer un cœur du processeur au logiciel Weka, ajouter les disques SSD et faire évoluer l’ensemble pour obtenir la taille du cluster désiré.
Il est même possible de choisir un stockage objet pour le tiering des données dans le Cloud. Un système d’erasure coding distribué, une technologie de protection des données qui distribue les fragments de données sur différentes cibles de manière redondante, assure la résistance du produit. Le tout se place dans un seul domaine de nommage global. La performance augmente linéairement à chaque ajout de cœur Weka et non d’ajout de système externe de stockage.
L’administration du stockage se réalise par l’application de règles manuelles qui s’appuient sur le type de fichier, la taille du fichier, sa date de création ou vous pouvez faire confiance aux algorithmes développés par Weka et conserver les règles fournies par défaut qui proposent 30 To de SSD, 500 To de stockage objet.
L’algorithme d’erasure coding employé est breveté et semble plus efficace en écriture que les algorithmes classiques comme celui de Reed Solomon. La solution autorise de plus des performances de 4 à 10 fois supérieures à celles d’appliances GPFS actuellement sur le marché pour un coût total de possession inférieur de 90 %.
De futurs développements
La solution devrait rapidement se doter de fonctions classiques comme le chiffrement des données, la déduplication et la compression. Des efforts vont aussi être réalisés pour affiner l’interface utilisateur et l’algorithme d’erasure coding.
Une autre priorité est le développement commercial par le recrutement de partenaires revendeurs de la solution. Une des belles surprises de nos récentes visites en Israël.
Source L'informaticien
Suivez-nous sur FaceBook ici: