Назад к курсу
АкадемияData Analytics + AIНеделя 2ClickHouse: колоночный OLAP
Урок 14Неделя 22 часа

ClickHouse: колоночный OLAP

Миллиарды строк за миллисекунды

1000xcolumnar

Быстрее PG на OLAP

2 PBMail.Ru

Данных в кластере

200ms-99.9%

Запрос на 50B строк

300Mreal-time

Пользователей

AI Insight

В Mail.Ru Group мы мигрировали аналитику с PostgreSQL на ClickHouse. Запрос, который занимал 3 минуты, стал выполняться за 200ms. Это позволило делать real-time дашборды для 300M пользователей.

Ключевые темы

ClickHouse — колоночная СУБД от Яндекса: 100-1000x быстрее PostgreSQL на агрегациях
Когда PostgreSQL vs ClickHouse: OLTP vs OLAP, строки vs столбцы
MergeTree движок: партиции, сортировка, granularity
Материализованные представления: ETL внутри базы
Кейс Mail.Ru: ClickHouse на 2 петабайта данных, 50B+ событий

Аналитика и графики

Старый подход vs AI-подход

🪦Старый век
🚀Новый век
Агрегация 1B строк

PostgreSQL — 2 минуты

1200x

ClickHouse — 100ms

Real-time дашборд

Предрасчёт в кроне каждый час

Live запросы за миллисекунды

Инструменты урока

ClickHouseclickhouse-clientDBeaverMetabase

Домашнее задание

Практическое задание

Установите ClickHouse. Загрузите датасет NYC Taxi (1M+ поездок). Напишите запросы: средняя стоимость по районам, пиковые часы, тренды по месяцам. Сравните скорость с PostgreSQL.

Урок 14 из 59