Databricks — американська компанія з корпоративного програмного забезпечення, заснована творцями Apache Spark[2]. Databricks розробляє веб-платформу для роботи зі Spark, яка забезпечує автоматизоване керування кластерами[en] та блокноти[en] в стилі IPython.

Databricks, Inc.
Тип бізнес
Галузь програмне забезпечення
Засновано 2013
Засновник(и) Алі Годсі[en], Енді Конвінскі, Арсалан Таваколі-Шираджі, Іон Стоіка[en], Матей Захарія, Патрік Венделл, Рейнольд Сін[en]
Штаб-квартира Сан-Франциско
Виторг $813 млн. (2022)[1]
databricks.com

ІсторіяРедагувати

Databricks виріс з проекту AMPLab[en] в Каліфорнійському університеті в Берклі, який був залучений до створення Apache Spark, фреймворка розподілених обчислень з відкритим кодом, побудованого на основі Scala. Компанію заснували Алі Годсі[en], Енді Конвінскі, Арсалан Таваколі-Шираджі, Іон Стоіка[en], Матей Захарія[3], Патрік Венделл і Рейнольд Сін[en].

У листопаді 2017 року компанія була анонсована як сторонній сервіс Microsoft Azure через інтеграцію Azure Databricks[4].

Компанія розробляє проект з відкритим кодом Delta Lake, який спрямований на забезпечення надійності озер даних, при використанні у машинному навчанні та задачах поширених у науці про дані[5].

У червні 2020 року Databricks придбала інструмент з відкритим кодом Redash, який допомогає науковцям і аналітикам даних візуалізувати та створювати інтерактивні інформаційні панелі своїх даних[6].

У лютому 2021 року Databricks разом з Google Cloud[en] забезпечили інтеграцію з рушієм Google Kubernetes і платформою BigQuery від Google[7]. Fortune оцінив Databricks як одне з найкращих великих «робочих місць для міленіалів» у 2021 році[8]. Тоді ж компанія заявила, що її продукцією користуються понад 5000 організацій[9].

У серпні 2021 року Databricks завершила свій восьмий раунд фінансування, зібравши 1,6 мільярда доларів і оцінка компанії склала 38 мільярдів доларів[10].

У жовтні 2021 року Databricks здійснила друге придбання німецької компанії 8080 Labs, яка створила платформу для розробки без використання коду[en]. Інструмент дослідження даних, створений цією компанією, який не вимагає кодування при використанні, — bamboolib[11].

ФінансуванняРедагувати

У вересні 2013 року Databricks оголосила, що залучила 13,9 мільйона доларів від Andreessen Horowitz, і заявила, що прагне запропонувати альтернативу системі MapReduce від Google[12][13]. Microsoft була відомим інвестором Databricks у 2019 році, залученим у Series E на невизначену суму[14][15]. Компанія залучила фінансування в розмірі 1,9 мільярда доларів, включаючи 1 мільярд доларів США Series G віл холдінгу Franklin Templeton та отримала грошову оцінку в 28 мільярдів доларів у лютому 2021 року. Серед інших інвесторів — Amazon Web Services, CapitalG[en] (компанія, що розвивається в рамках Alphabet, Inc.) і Salesforce Ventures[9].

Раунди фінансування
Серія Дата Сума (млн дол.) Провідні інвестори
A 2013 13.9[12] Andreessen Horowitz
B 2014 33[16] New Enterprise Associates[en]
C 2016 60[17] New Enterprise Associates[en]
D 2017 140[18] Andreessen Horowitz
E Feb. 2019 250[19] Andreessen Horowitz
F Oct. 2019 400[20] Andreessen Horowitz
G Jan. 2021 1,000[21] Franklin Templeton Investments
H Aug. 2021 1,600[22] Morgan Stanley

ПродуктиРедагувати

Databricks розробляє та продає хмарну платформу даних, використовуючи маркетинговий термін «Lakehouse», що є словозлиттям на основі термінів «сховище даних» та «озеро даних[en]»[23]. Lakehouse від Databricks базується на фреймворку Apache Spark з відкритим кодом, який дозволяє виконувати аналітичні запити до напівструктурованих даних без використання традиційної схеми бази даних[24].

Delta Engine від Databricks був запущений у червні 2020 року як новий механізм запитів, який розташовується поверх Delta Lake, щоб підвищити продуктивність запитів[25]. Він сумісний з Apache Spark і MLflow, які також є проектами з відкритим кодом від Databricks[26].

У листопаді 2020 року компанія Databricks представила Databricks SQL (раніше відома як SQL Analytics) для запуску бізнес-аналітики та звітності на основі озер даних. Аналітики можуть запитувати набори даних безпосередньо за допомогою стандартного SQL або використовувати конектори продуктів для безпосередньої інтеграції з інструментами бізнес-аналітики, такими як Tableau[en], Qlik, Looker і ThoughtSpot[en][27].

Databricks також пропонує платформу для інших задач, зокрема для машинного навчання, зберігання та обробки даних, потокової аналітики та бізнес-аналітики[28].

Компанія також створила проекти з відкритим кодом Delta Lake, MLflow і Koalas, які охоплюють інженерію даних[en], науку про дані та машинне навчання[29]. Окрім створення платформи Databricks, компанія спільно організувала масові відкриті онлайн-курси по Spark[30] та конференцію для спільноти Spark під назвою Data + AI Summit[31], раніше відому як Spark Summit.

ДіяльністьРедагувати

Штаб-квартира Databricks знаходиться в Сан-Франциско[32]. Також компанія працює в Канаді, Великобританії, Нідерландах, Сінгапурі, Австралії, Німеччині, Франції, Японії, Китаї, Індії та Бразилії.

ПриміткиРедагувати

  1. Databricks reaches $813M ARR. 
  2. Dwoskin, Elizabeth (9 червня 2016). This is where the real action in artificial intelligence takes place. Washington Post. Процитовано 16 серпня 2016. 
  3. Zaharia, Matei. Matei Zaharia. Процитовано 16 серпня 2016. 
  4. Microsoft makes Databricks a first-party service on Azure. TechCrunch (амер.). Процитовано 6 квітня 2021. 
  5. Databricks launches Delta Lake, an open source data lake reliability project. VentureBeat (амер.). 24 квітня 2019. Процитовано 6 квітня 2021. 
  6. Databricks acquires Redash, a visualizations service for data scientists. TechCrunch (амер.). Процитовано 6 квітня 2021. 
  7. Databricks brings its lakehouse to Google Cloud. TechCrunch (амер.). Процитовано 18 лютого 2021. 
  8. 100 Best Large Workplaces for Millennials. Fortune. 16 червня 2021. Процитовано 16 липня 2021. 
  9. а б Konrad, Alex (2 лютого 2021). Databricks Raises $1 Billion At $28 Billion Valuation, With The Cloud's Elite All Buying In. Forbes (англ.). Процитовано 29 липня 2021. 
  10. Mellor, Chris (1 вересня 2021). Databricks raises data lake of cash at monstrous $38bn valuation. Blocks & Files. Процитовано 4 вересня 2021. 
  11. Eric Rosenbaum (6 жовтня 2021). $38 billion software start-up Databricks makes acquisition to leave code behind. CNBC. Процитовано 20 лютого 2022. 
  12. а б Harris, Derrick (25 вересня 2013). Databricks raises $14M from Andreessen Horowitz, wants to take on MapReduce with Spark. Процитовано 28 вересня 2014. 
  13. Lorica, Ben (25 вересня 2013). Databricks aims to build next-generation analytic tools for Big Data. O'Reilly Media. Процитовано 28 вересня 2014. 
  14. Databricks raises $250M at a $2.75B valuation for its analytics platform. TechCrunch (амер.). Процитовано 8 квітня 2021. 
  15. Novet, Jordan (5 лютого 2019). Microsoft used to scare start-ups but is now an 'outstandingly good partner,' says Silicon Valley investor Ben Horowitz. CNBC (англ.). Процитовано 6 квітня 2021. 
  16. Miller, Ron (30 червня 2014). Databricks Snags $33M In Series B And Debuts Cloud Platform For Processing Big Data. TechCrunch. Процитовано 28 вересня 2014. 
  17. Shieber, Jonathan. Databricks raises $60 million to be big data's next great leap forward. TechCrunch. Процитовано 16 грудня 2016. 
  18. Databricks Secures $140 Million to Accelerate Analytics and Artificial Intelligence in the Enterprise. Databricks (амер.). Процитовано 16 травня 2019. 
  19. Databricks' $250 Million Funding Supports Explosive Growth and Global Demand for Unified Analytics; Brings Valuation to $2.75 Billion. Databricks (амер.). Процитовано 5 лютого 2019. 
  20. Databricks announces $400M round on $6.2B valuation as analytics platform continues to grow. TechCrunch (амер.). Процитовано 24 жовтня 2019. 
  21. Databricks raises $1B at $28B valuation as it reaches $425M ARR. Tech Crunch (амер.). Процитовано 14 лютого 2021. 
  22. Databricks raises $1.6B at $38B valuation as it blasts past $600M ARR. Tech Crunch (амер.). Процитовано 1 липня 2021. 
  23. Michael, Armbrust; Ghodsi, Ali; Xin, Reynold; Zaharia, Matei (January 2021). Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics. Conference on Innovative Data Systems Research. Процитовано 29 липня 2021. 
  24. With massive $1B infusion, Databricks takes aim at IPO and rival Snowflake. SiliconANGLE (амер.). 1 лютого 2021. Процитовано 8 квітня 2021. 
  25. Databricks Cranks Delta Lake Performance, Nabs Redash for SQL Viz. Datanami. 24 червня 2020. Процитовано 8 квітня 2021. 
  26. Databricks launches Delta Lake, an open source data lake reliability project. VentureBeat (амер.). 24 квітня 2019. Процитовано 8 квітня 2021. 
  27. Databricks launches SQL Analytics. TechCrunch (амер.). Процитовано 8 квітня 2021. 
  28. Brust, Andrew. Databricks, champion of data "lakehouse" model, closes $1B series G funding round. ZDNet (англ.). Процитовано 8 квітня 2021. 
  29. The Two Sigma Ventures Open Source Index. Two Sigma Ventures (англ.). Процитовано 8 квітня 2021. 
  30. Databricks to run two massive online courses on Apache Spark. Databricks (амер.). 2 грудня 2014. Процитовано 16 грудня 2016. 
  31. Data + AI Summit. Databricks (амер.). Процитовано 8 квітня 2021. 
  32. staff, CNBC com (16 червня 2020). 36. Databricks. CNBC (англ.). Процитовано 8 квітня 2021.