Databricks - Une plateforme unifiée pour collaborer en matière de données, d'analyses et d'IA
Publié: 2023-10-26Company Profile est une initiative de StartupTalky visant à publier des informations vérifiées sur différentes startups et organisations.
Le monde moderne dans lequel nous vivons aujourd’hui dépend massivement des données et des informations. Tout ce qui nous entoure, les choses que nous utilisons, voyons et qui nous entourent, sont influencés d'une manière ou d'une autre par la technologie.
À mesure que le besoin de technologie augmente, l’importance des données a commencé à prendre de l’ampleur. Avec l’accumulation de données, le besoin d’un entrepôt pour stocker, analyser et traiter ces données à des fins multiples est apparu.
C'est là que Databricks a fait apparaître sa plateforme. Databricks sert de plate-forme cloud pour stocker d'énormes données qui peuvent être traitées et exécutées en douceur. Il s'agit d'une plate-forme analytique construite sur leur produit open source populaire appelé Apache Spark . Ils occupent une part de marché de 10,19 % et sont le troisième acteur en importance sur le marché de l'analyse numérique.
Databricks - Points forts de l'entreprise
Nom de démarrage | Briques de données |
---|---|
Quartier général | San Francisco, Californie, États-Unis |
Industrie | Logiciels informatiques, données, IA |
Fondateurs | Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia et Arsalan Tavakoli |
Fondé | 2013 |
Site web | databricks.com |
Databricks - À propos
Databricks - Industrie
Databricks - Fondateurs
Databricks - Histoire de startup
Databricks-Mission
Databricks-Logo
Databricks - Modèle commercial et de revenus
Databricks - Employés
Databricks - Financement et investisseurs
Databricks - Acquisitions
Databricks - Présence sur les réseaux sociaux
Databricks - Croissance et revenus
Databricks - Produits et fonctionnalités
Databricks - Investissement
Databricks - Partenariats
Databricks - Concurrents
Databricks - Projets futurs
Databricks - À propos
Databricks a été créée par les créateurs d' Apache Spark , en tant que société de données et d'intelligence artificielle (IA). Il agit comme un entrepôt pour toutes les données structurées ou non structurées, sur le cloud. Databricks sert également de plate-forme combinée pour toutes vos fonctions de données, d'IA et d'analyse qui aide les ingénieurs de données, les analystes et les scientifiques des données à effectuer d'énormes charges de travail de manière transparente. Cela est réalisé par leur plate-forme Lakehouse optimisée par Apache Spark, qui constitue la meilleure combinaison de fonctionnalités des Data Lakes (faible coût et flexibilité) et des Data Warehouses (efficacité des performances).
Outre Apache Spark, Delta Lake et MLflow sont les deux autres projets open source qui sont à l'origine des fonctions efficaces de la plateforme Lakehouse. Databricks fournit ses services de données unifiées via plusieurs cloud, à savoir Google Cloud, AWS, Microsoft Azure et Alibaba Cloud.
Databricks - Industrie
L’industrie des données est devenue une industrie vaste et importante dans tous les aspects de la vie et des affaires. Selon Statista, le marché des données devrait atteindre 103 milliards de dollars d’ici 2027. Il représente le double de sa présence en 2018. L’intelligence artificielle est un autre marché en croissance rapide qui est devenu un élément essentiel des industries modernes.
Databricks - Fondateurs
Databricks a été cofondée par quelques professeurs de l'Université de Californie et cinq anciens doctorants de Berkeley. étudiants.
- Ali Ghodsi , co-fondateur et PDG de Databricks, était l'un des créateurs d'Apache Spark. Il a été professeur à l'Université de Californie (UC) ainsi que membre du conseil d'administration du Rising Lab de l'UC. Il a assumé la responsabilité principale de la croissance et de l’expansion de Databricks dans le monde.
- Ion Stoica , co-fondateur et président de Databricks, est également professeur à l'UC Berkeley. Il est également codirecteur d'AMPLab. Parallèlement, il a cofondé une start-up appelée Conviva , pour la distribution de vidéos à grande échelle.
- Matei Zaharia , co-fondateur et technologue en chef chez Databricks, faisait auparavant partie du projet Spark et est désormais vice-président de la Fondation Apache. Le prix de thèse de doctorat ACM lui a été décerné en 2014 pour ses recherches sur les systèmes informatiques à grande échelle.
- Patrick Wendell , co-fondateur et vice-président de l'ingénierie chez Databricks, a joué un rôle majeur dans les opérations de Spark.
- Reynold Xin , co-fondateur et architecte en chef et s'occupe des opérations techniques dans Apache Spark. Il a remporté le prix de la meilleure démo en 2011 au VLDB.
- Andy Konwinski , co-fondateur et vice-président de la direction, s'occupe des opérations d'IA chez Databricks. Auparavant, il s'est occupé des efforts de marché de l'entreprise lors de la création du Spark Summit.
- Arsalan Tavakoli-Shiraji , co-fondateur et vice-président principal de l'ingénierie de terrain chez Databricks, a auparavant travaillé chez McKinsey en tant que directeur associé. Il était un ancien doctorant. étudiant à l'UC Berkeley.
Databricks - Histoire de startup
Ali Ghodsi, PDG de Databricks, était passionné de codage depuis l'âge de 8 ans lorsque ses parents lui ont acheté un Commodore 64 d'occasion. Il a poursuivi ses études supérieures en ingénierie informatique et a obtenu un doctorat. en informatique distribuée. Plus tard, en 2009, il s'associe à Ion Stoica et ils créent ensemble « Spark », déjà à l'instigation de Matei Zaharia.
Ils se sont ensuite coordonnés avec une autre équipe travaillant sur l'apprentissage automatique et ont introduit ensemble « Apache Spark » sur le marché. Au début, aucune entreprise n’y prêtait attention, car la technologie semblait étrangère. En 2013, Ben Horowitz (co-fondateur d'Andreessen Horowitz VC) leur a donné un peu d'espoir en investissant 14 millions de dollars et les a encouragés à créer une entreprise qui sert de plate-forme pour gérer Apache Spark. Ainsi, Databricks a été créée en 2013.
Databricks-Mission
Databricks a pour mission de rendre l'unification des données plus efficace, en innovant de nouvelles techniques pour unifier les données, l'IA et l'analyse. Ils s'efforcent de rendre l'expérience client plus attrayante.
Databricks-Logo
Le logo Databricks ressemble à deux briques parfaitement alignées comme des dossiers de données organisés sur une étagère. Il semble que Databricks ait eu l'intention de conserver le logo avec un point de départ et un point d'arrivée sans aucune interruption entre les deux. Cela peut impliquer qu'ils unifient les fonctions de collecte, de stockage et d'analyse de données sous une plate-forme commune sans avoir besoin de sortie, car tout est couvert ici.
Databricks - Modèle commercial et de revenus
Leur modèle économique est positionné sur le logiciel Web qui fournit une plate-forme pour travailler avec Apache Spark. Il facilite la gestion automatique des groupes et les blocs-notes de style Python pour les ingénieurs de données et les scientifiques.
Databricks fournit ses ressources sous forme de Software as a Service (SaaS) et génère des revenus grâce à ses abonnements. Leurs principaux services s'effectuent à travers trois plateformes cloud à savoir :
- Microsoft Azure
- Google Cloud
- Services Web Amazon
Bien que les prix varient pour chaque cloud, il existe un facteur commun à noter : « Ne payez que ce que vous utilisez » . Les coûts sont calculés indépendamment des services choisis et ne nécessitent aucun paiement initial. Les clients sont tenus de payer uniquement pour le nombre de ressources utilisées au fur et à mesure.
Databricks - Employés
Databricks compte plus de 5 001 à 10 000 employés dans le monde en 2023. En novembre 2019, Databricks a célébré le jalon de l'embauche du 1 000e employé à temps plein pour eux. Il a fallu 6 ans pour atteindre les 1 000 premiers salariés et moins de 2 ans pour embaucher le reste.
Databricks - Financement et investisseurs
Avec son récent financement de 503,7 millions de dollars, Databricks a levé 4 milliards de dollars au cours de 12 cycles de financement depuis sa création. Jusqu'à présent, 49 investisseurs au total ont investi dans Databricks.
Date | Scène | Montant | Investisseurs |
---|---|---|---|
14 septembre 2023 | Série I | 503,7 millions de dollars | Prix T. Rowe |
31 juillet 2023 | Marché secondaire | - | - |
3 mars 2023 | Série H | - | - |
4 septembre 2021 | Ange rond | 200 000 $ | - |
31 août 2021 | Série H | 1,6 milliard de dollars | Counterpoint Global (Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, une suite de fonds BNY Mellon, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, the House Fund Géodésique et Green Bay Ventures. |
1 février 2021 | Série G | 1 milliard de dollars | Franklin Templeton, Conseil d'investissement du RPC, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital et Octahedron Capital. |
22 octobre 2019 | Série F | 400 millions de dollars | Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic et Green Bay Ventures. |
5 février 2019 | Série E | 250 millions de dollars | Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures et Geodesic Capital. |
22 août 2017 | Série D | 140 millions de dollars | New Enterprise Association, Andreessen Horowitz, Battery Ventures, Geodesic Capital et Green Bay Ventures. |
15 décembre 2016 | Série C | 60 millions de dollars | Association des nouvelles entreprises, Andreessen Horowitz et SineWave Ventures. |
30 juin 2014 | Série B | 33 millions de dollars | Association des nouvelles entreprises, Andreessen Horowitz et DCVC. |
25 septembre 2013 | Série A | 14 millions de dollars | Andreessen Horowitz, SV Angel et Alfred Chuang. |
Databricks - Acquisitions
Databricks a jusqu'à présent acquis sept sociétés. Ci-dessous les détails :
Nom du compte | Date | Montant |
---|---|---|
Arcion | 23 octobre 2023 | 100 millions de dollars |
MosaïqueML | 26 juin 2023 | 1,3 milliard de dollars |
Okéra | 3 mai 2023 | - |
DataJoy Inc. | 13 octobre 2022 | - |
Laboratoires Cortex | 15 avril 2022 | - |
8080 Laboratoires | 6 octobre 2021 | - |
Redash | 24 juin 2020 | - |
Databricks - Présence sur les réseaux sociaux
Databricks est bien présent sur Twitter et LinkedIn et utilise ces plateformes pour promouvoir ses produits et services afin d'obtenir un avantage sur le marché. Ils publient également des informations sur leurs tournées mondiales et lancent des événements avec leurs dernières inventions. Des liens vers des blogs et des articles présentant Databricks ou leurs produits et des informations relatives aux offres d'emploi peuvent également être trouvés sur leurs plateformes sociales.
Databricks - Croissance et revenus
Databricks a été créé en 2013, gardant la technologie Spark comme noyau. Sa création a été immédiatement suivie par une rumeur selon laquelle « la technologie Spark ne fonctionnera pas si vos données ne rentrent pas dans leur mémoire ». Cela a découragé les entreprises d'utiliser Spark.
Finalement, en 2015, les fondateurs ont décidé de mettre fin à ces rumeurs en participant à un concours au cours duquel ils ont battu le record du monde de traitement d'un pétaoctet de données dans le temps le plus court et ont ainsi gagné en popularité et en attention médiatique.
En 2017, ils étaient évalués à 500 millions de dollars, mais leur revenu annuel était bien inférieur à 1 million de dollars. Plus tard, participer au « concours de tri », apporter quelques changements dans le recrutement des employés et décider de créer des logiciels dotés des fonctionnalités demandées par les grandes entreprises, s'est avéré fructueux.
Depuis lors, la croissance de Databricks ne fait que s’accentuer. Leurs revenus ont atteint la barre des 100 millions de dollars pour la première fois en 2018 et n'ont mis qu'un an de plus pour atteindre 200 millions de dollars en 2019. L'introduction de la fonctionnalité Lakehouse a été l'un des principaux facteurs de son succès. La valorisation de la société est passée de 6,2 milliards de dollars au troisième trimestre 2019 à environ 38 milliards de dollars au troisième trimestre 2021.
Databricks a déclaré un chiffre d'affaires récurrent annuel de 425 millions de dollars en 2020.
Databricks a révélé qu'au cours de l'exercice clos le 31 janvier 2023, il avait généré plus d'un milliard de dollars de revenus. L’entreprise a déclaré avoir connu une croissance de plus de 60 % au cours de l’année précédente, 2022.
Databricks - Produits et fonctionnalités
Certains des derniers lancements importants sont :
Unité des données avec la nouvelle version de Delta Lake
Databricks a annoncé une nouvelle version de son format de stockage de données Delta Lake le 28 juin 2023. Selon l'entreprise, cette version élimine les silos de données. Le dernier ajout aux normes open source rivales pour les tables de données analytiques dans les systèmes de lacs de données est Delta Lake 3.0, qui inclut Iceberg et Hudi de la Fondation Apache.
Chariot
Databricks a dévoilé un modèle de langage open source qui permet aux programmeurs de créer leurs propres applications de chatbot pilotées par l'IA le 24 mars 2023.
Fédération Lakehouse
Lors de son Data + AI Summit, Databricks a lancé ce qu'elle appelle sa fonction Lakehouse Federation le 28 juin 2023. Avec cette nouvelle fonctionnalité, les entreprises peuvent découvrir, interroger et administrer leurs données sur un large éventail de plateformes en combinant leurs données disparates. systèmes de données cloisonnés.
Databricks - Partenariats
Databricks s'est associé à de nombreuses entreprises. Certains des derniers partenariats importants sont :
Microsoft
Avec un nouveau partenariat avec Databricks en août 2023 pour commercialiser des outils de développement d'applications d'IA, Microsoft a élargi la portée de ses objectifs en matière d'IA. Les entreprises pourront créer leurs propres modèles d'IA à partir de zéro à l'aide du logiciel Databricks.
Kobaï
Le 11 septembre 2023, Databricks et Kobai se sont associés. Les clients peuvent profiter de la puissance et de l'évolutivité de la plateforme Databricks Lakehouse, ainsi que de la simplicité et des informations des graphiques de connaissances.
3i Infotech
Afin de générer de la valeur commerciale en combinant données et IA sur une seule plateforme, 3i Infotech Ltd et Databricks se sont associés le 18 octobre 2023.
Databricks - Investissement
Databricks a investi dans 24 entreprises. Certains des investissements sont répertoriés ci-dessous :
Nom du compte | Date | Montant |
---|---|---|
IA de perplexité | 2022 | - |
Arcion | 2018 | - |
Prophétie.io | janvier 2017 | - |
Catalyseur | septembre 2017 | - |
Laboratoire propre | - | - |
Databricks - Concurrents
Certains des principaux concurrents de Databricks sont :
- Flocon de neige
- Cloudera
- Datastax
- Qubole
- MATLAB
- Altéryx
- Drémio
- Intellicus
Voici quelques comparaisons avec certains concurrents :
Flocon de neige – Snowflake est beaucoup plus grand que Databricks. Ils offrent tous deux des services similaires avec quelques différences (Databricks traite des données volumineuses tandis que Snowflake offre l'élasticité des données cloud pour un accès centralisé) à un prix flexible. Databricks mène une longue bataille pour vaincre son concurrent.
Cloudera - Cloudera fournit une plate-forme commune de stockage et de gestion cloud qui stocke, traite et analyse les données d'une organisation. Il est similaire à celui des Databricks sous la forme d'entrepôt de données, de traitement et de distribution.
Databricks - Projets futurs
Il est évident que Databricks travaillait sur deux des domaines Big Data à la croissance la plus rapide, le streaming et le Deep-Learning en 2021. Ils construisaient une interface de programmation d'application (API) à multiples facettes pour traiter ces deux domaines. Databricks souhaite également accélérer l'innovation de Data Lakehouse pour obtenir un plus grand avantage en conquérant les organisations basées sur les données.
Selon leur site Web, Databricks prévoit d'activer la fonctionnalité Favoris de l'espace de travail. Les notes, tableaux de bord, expériences et recherches peuvent tous être enregistrés dans une liste de favoris, à laquelle vous pouvez ensuite accéder depuis la page d'accueil.
Databricks - FAQ
Qu’est-ce que Databricks ?
Databricks est un outil basé sur le cloud permettant de stocker et de traiter d'énormes quantités de données à l'aide de modèles de Machine Learning. Cela se fait via leur outil Apache Spark.
Qui a fondé Databricks ?
Databricks a été cofondé par sept personnes, à savoir Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski et Arsalan Tavakoli-Shiraji.
Quel montant Databricks a-t-il obtenu grâce au financement ?
Databricks a obtenu environ 4 milliards de dollars grâce à 12 cycles de financement.
Quel est le chiffre d’affaires annuel de Databricks ?
Databricks a déclaré un revenu annuel récurrent (ARR) de 1,275 milliard de dollars pour l'année se terminant en 2022.
Qui sont les clients de Databricks ?
Databricks compte plus de 6 000 clients dans le monde. Certains de leurs clients populaires sont :
- Coquille
- CVS Santé
- Régénéron
- T Mobile
- HSBC
- Comcast