Rivalry2

HTML Diff

0 added 0 removed

Original 2026-01-01

Modified 2026-03-10

1 Поговорим о том, когда появился терминDataOps, а также в каком году он прочно вошел в лексикон специалистов по данным.

2 Термин DataOps (от Data Operations) впервые прозвучал в 2015 г., и произошло это в блогеЭнди Палмера. Энди Палмер, наряду с легендарным Майклом Стоунбрейкером, является сооснователем компании Tamr.

3 Следующее упоминание оDataOpsпроизошло уже в марте 2017 г. на конференции"Strata+Hadoop World". И прошло оно не просто так, ведь термин был зафиксирован в книге "Creating a Data-Driven Enterprise with DataOps", причем написана эта книга была не кем-нибудь, а специалистами, 4 года работавшими над проектомApache Hiveв командеFacebook Data Service Team.

4 Тут уместно будет вспомнить движение"SQL для Hadoop", которое было начатоHiveи нацелено на решение проблемы по предоставлению аналитикам удобных средств для работы с большими данными. Ведь, несмотря на наличие множества инструментов обработкиBig Data, Hadoop до сих пор является трудным даже для специалистов по данным, не говоря о бизнесе, который вовсе не хочет тратить время на освоение, в результате чего в алгоритме "потоки гетерогенных данных - специалисты по данным - конечные юзеры" формируется узкое место -- "бутылочное горлышко". Причем для устранения этого узкого места одного лишь средства доступа к данным явно недостаточно - надо ведь еще и обеспечить сбор/подготовку данных, надо управлять эксплуатацией данных и вовремя реагировать на рост/падение объемов и нагрузок. А еще крайне важно снабжать аналитиков именно "свежими" данными, ну а разработчиков - "живыми задачами", которые способны привести к значимым для бизнеса результатам в сжатые сроки.

5 Как же достичь такой "нирваны" при общении с данными? И вот здесь-то на сцену и вышелDataOps. Собственно говоря, в отличие от множества модных терминов, расшифровывать слово DataOps, по сути, и не нужно, ведь и так понятно, что разговор идетоб интеграциитаких ветвей, как аналитика, разработка и эксплуатация в условиях BigData, то есть перед нами, если говорить простыми словами, не что иное, какDevOps для больших данных(хотя, конечно же, нюансы в интерпретации деталей вполне себе допустимы). Не секрет, что компаниям, бизнес которых выстроен на Big Data, приходится чуть ли не каждый день вводить в эксплуатацию новые сервисы, созданные на основе данных. Такие практики естественны и применялись задолго до DataOps.

6 Но именно с появлением последней, состояние "нирваны" при общении с данными почувствовали такие гиганты, какLinkedIn, eBay, Twitter, Uber и Netflix. Именно эти компании в числе первых увидели на примереFacebook, что данные в современном мире - это власть, особенно если вы умеете работать с этими данными, опираясь не только на технологии, но и путем изменения всей культуры, как это, к слову, и предусматривает концепция DataOps.

7 В связи со всем вышесказанным, становится даже странным и удивительным, что термин появился так поздно. По сути, он и вошел-то в лексикон инженеров по данным всего лишь конце 2017 г. и только потом был узаконен аналитикамиGartnerв IT-глоссарии, где это понятие характеризуется следующим образом:

8 Ну и, напоследок, вспомнимглавные принципы DataOps:

9 <ul><li>следует думать не о серверах, а о сервисах;</li>

10 <li>инфраструктура работы с данными представляет собой код;</li>

11 <li>автоматизируйте все!</li>

12 <li>не забывайте проDevOps: компания, управляемая данными, представляет собойDataOps + DevOps, которые реализованы с учетом принциповAgile.</li>

13 </ul>По материалам https://www.osp.ru/.