Агрегатные функции

ClickHouse поддерживает все стандартные агрегатные функции SQL (sum, avg, min, max, count), а также широкий набор других агрегатных функций.

Страница	Описание
aggThrow	Эту функцию можно использовать для проверки безопасности кода при работе с исключениями. При создании она будет генерировать исключение с указанной вероятностью.
analysisOfVariance	Предоставляет статистический критерий для однофакторного дисперсионного анализа (тест ANOVA). Это критерий для нескольких групп нормально распределённых наблюдений, позволяющий определить, одинаковы ли средние значения во всех группах.
any	Выбирает первое встреченное в столбце значение.
anyHeavy	Выбирает часто встречающееся значение с использованием алгоритма heavy hitters. Если существует значение, которое встречается более чем в половине случаев в каждом из потоков выполнения запроса, возвращается именно оно. Как правило, результат недетерминирован.
anyLast	Возвращает последнее встретившееся значение столбца.
approx_top_k	Возвращает массив наиболее часто встречающихся (приблизительно) значений в указанном столбце и количества их вхождений.
approx_top_sum	Возвращает массив приблизительно самых частых значений и числа их вхождений в указанном столбце.
argMax	Вычисляет значение `arg` при максимальном значении `val`.
argMin	Вычисляет значение `arg` для минимального значения `val`. Если существует несколько строк с одинаковым значением `val`, являющимся максимальным, выбор возвращаемого связанного значения `arg` является недетерминированным.
argAndMin	Вычисляет значения `arg` и `val` для минимального значения `val`. Если существует несколько строк с одинаковым минимальным значением `val`, то выбор того, какая пара связанных значений `arg` и `val` будет возвращена, не детерминирован.
argAndMax	Вычисляет значения `arg` и `val` для максимального значения `val`. Если существует несколько строк с одинаковым максимальным `val`, то то, какие связанные значения `arg` и `val` будут возвращены, не определено.
groupArrayArray	Объединяет массивы в один более крупный массив массивов.
avg	Вычисляет арифметическое среднее значение.
avgWeighted	Вычисляет взвешенное среднее арифметическое.
boundingRatio	Агрегатная функция, которая вычисляет наклон между самой левой и самой правой точками по группе значений.
categoricalInformationValue	Вычисляет значение `(P(tag = 1) - P(tag = 0)) (log(P(tag = 1)) - log(P(tag = 0)))` для каждой категории.
contingency	Функция `contingency` вычисляет коэффициент контингенции — величину, измеряющую степень связи между двумя столбцами таблицы. Вычисление аналогично функции `cramersV`, однако использует другой знаменатель под знаком квадратного корня.
corr	Вычисляет коэффициент корреляции Пирсона.
corrMatrix	Вычисляет корреляционную матрицу для N переменных.
corrStable	Вычисляет коэффициент корреляции Пирсона, но использует численно устойчивый алгоритм.
count	Считает количество строк или значений, отличных от NULL.
covarPop	Вычисляет ковариацию генеральной совокупности
covarPopMatrix	Возвращает матрицу ковариации генеральной совокупности по N переменным.
covarPopStable	Вычисляет значение ковариации по генеральной совокупности
covarSamp	Вычисляет значение `Σ((x - x̅)(y - y̅)) / (n - 1)`
covarSampMatrix	Возвращает выборочную ковариационную матрицу по N переменным.
covarSampStable	Аналогична covarSamp, но работает медленнее и даёт меньшую вычислительную погрешность.
cramersV	Результат функции `cramersV` лежит в диапазоне от 0 (что соответствует отсутствию связи между переменными) до 1 и может достигать 1 только тогда, когда каждое значение одной переменной полностью определяется значением другой. Его можно рассматривать как меру связи между двумя переменными, выраженную в процентах от их максимально возможной вариации.
cramersVBiasCorrected	Вычисляет V Крамера с учетом смещения (bias-correction).
deltaSum	Суммирует арифметическую разность между соседними строками.
deltaSumTimestamp	Добавляет разницу между соседними строками. Если разница отрицательная, она игнорируется.
entropy	Вычисляет энтропию Шеннона для столбца значений.
estimateCompressionRatio	Оценивает коэффициент сжатия указанного столбца без фактического выполнения сжатия.
exponentialMovingAverage	Вычисляет экспоненциальное скользящее среднее значений за заданный интервал времени.
exponentialTimeDecayedAvg	Возвращает экспоненциально сглаженное взвешенное скользящее среднее значений временного ряда в момент времени `t`.
exponentialTimeDecayedCount	Возвращает накопленное экспоненциальное затухание для временного ряда в момент времени с индексом `t`.
exponentialTimeDecayedMax	Возвращает максимум из значений экспоненциально сглаженного скользящего среднего в момент времени `t` и в момент `t-1`.
exponentialTimeDecayedSum	Возвращает сумму значений экспоненциально сглаженного скользящего среднего временного ряда в момент времени `t`.
first_value	Это псевдоним агрегатной функции `any`, он был добавлен для совместимости с оконными функциями, где иногда требуется обрабатывать значения `NULL` (по умолчанию все агрегатные функции ClickHouse игнорируют значения `NULL`).
flameGraph	Агрегатная функция, строящая флеймграф по списку стек-трейсов.
groupArray	Создает массив из значений аргументов. Значения могут добавляться в массив в любом (произвольном) порядке.
groupArrayInsertAt	Вставляет значение в массив на указанную позицию.
groupArrayIntersect	Возвращает пересечение заданных массивов (все элементы, которые присутствуют во всех этих массивах).
groupArrayLast	Создаёт массив из значений последнего аргумента.
groupArrayMovingSum	Вычисляет скользящую сумму входных значений.
groupArrayMovingAvg	Вычисляет скользящее среднее для входных значений.
groupArraySample	Создаёт массив выборочных значений аргумента. Размер результирующего массива ограничен не более чем `max_size` элементами. Значения аргумента выбираются случайным образом и добавляются в массив.
timeSeriesGroupArray	Сортирует временные ряды по метке времени в порядке возрастания.
groupArraySorted	Возвращает массив из первых N элементов в порядке возрастания.
groupBitAnd	Применяет операцию побитового `AND` к последовательности чисел.
groupBitmap	Битовые или агрегатные вычисления по столбцу беззнакового целого возвращают мощность множества типа UInt64; при добавлении суффикса -State возвращается объект bitmap.
groupBitmapAnd	Вычисляет пересечение (AND) значений столбца Bitmap и возвращает его кардинальность типа UInt64; при добавлении суффикса -State возвращает объект Bitmap.
groupBitmapOr	Вычисляет операцию OR над битмап-столбцом и возвращает мощность множества типа UInt64, а при добавлении суффикса -State — объект битмапа. Эквивалентно `groupBitmapMerge`.
groupBitmapXor	Вычисляет XOR по столбцу битовой карты и возвращает кардинальность типа UInt64, а при использовании с суффиксом -State возвращает объект битовой карты
groupBitOr	Выполняет побитовую операцию `OR` над последовательностью чисел.
groupBitXor	Применяет побитовое `XOR` к последовательности чисел.
groupUniqArray	Создает массив из значений переданных аргументов.
intervalLengthSum	Вычисляет суммарную длину объединения всех диапазонов (отрезков на числовой оси).
kolmogorovSmirnovTest	Применяет критерий Колмогорова–Смирнова к выборкам из двух генеральных совокупностей.
kurtPop	Вычисляет эксцесс последовательности.
kurtSamp	Вычисляет выборочный эксцесс для последовательности.
largestTriangleThreeBuckets	Применяет алгоритм Largest-Triangle-Three-Buckets к исходным данным.
last_value	Выбирает последнее встреченное значение, аналогично `anyLast`, но допускает NULL.
mannWhitneyUTest	Применяет ранговый критерий Манна–Уитни к выборкам из двух генеральных совокупностей.
max	Агрегатная функция, вычисляющая максимальное значение в группе значений.
maxIntersections	Агрегатная функция, вычисляющая максимальное количество пересечений внутри группы интервалов (при условии, что все интервалы пересекаются хотя бы один раз).
maxIntersectionsPosition	Агрегатная функция, вычисляющая позиции вхождений, определённых функцией maxIntersections.
maxMap	Вычисляет максимальное значение из массива `value` по ключам, указанным в массиве `key`.
meanZTest	Применяет z-тест для проверки среднего по выборкам из двух генеральных совокупностей.
median	Функции `median` являются псевдонимами соответствующих функций `quantile`. Они вычисляют медиану выборки числовых данных.
min	Агрегатная функция, вычисляющая минимум над группой значений.
minMap	Вычисляет минимум массива `value` по ключам, указанным в массиве `key`.
quantile	Вычисляет приближённый квантиль последовательности числовых данных.
quantileDD	Вычисляет приближённый квантиль выборки с гарантированной относительной погрешностью.
quantileBFloat16	Вычисляет приближённый квантиль выборки, состоящей из чисел формата bfloat16.
quantileDeterministic	Вычисляет приближённый квантиль последовательности числовых данных.
Функции quantileExact	функции quantileExact, quantileExactLow, quantileExactHigh, quantileExactExclusive, quantileExactInclusive
quantileExactWeighted	Точно вычисляет квантиль числового набора данных с учётом веса каждого элемента.
quantileGK	Вычисляет квантиль для числовой последовательности данных с помощью алгоритма Гринвальда — Ханны.
quantileExactWeightedInterpolated	Вычисляет квантиль последовательности числовых данных с использованием линейной интерполяции, с учетом веса каждого элемента.
quantileInterpolatedWeighted	Вычисляет квантиль последовательности числовых данных с использованием линейной интерполяции с учётом веса каждого элемента.
Функции quantiles	quantiles, quantilesExactExclusive, quantilesExactInclusive, quantilesGK
quantileTDigest	Вычисляет приближённый квантиль последовательности числовых данных с использованием алгоритма t-digest.
quantileTDigestWeighted	Вычисляет приближённый квантиль последовательности числовых данных с использованием алгоритма t-digest.
quantileTiming	С указанной точностью вычисляет квантиль последовательности числовых данных.
quantileTimingWeighted	С заданной точностью вычисляет квантиль последовательности числовых данных с учётом веса каждого элемента последовательности.
rankCorr	Вычисляет коэффициент ранговой корреляции.
simpleLinearRegression	Выполняет простую (одномерную) линейную регрессию.
singleValueOrNull	Агрегатная функция `singleValueOrNull` используется для реализации операторов подзапросов, таких как `x = ALL (SELECT ...)`. Она проверяет, существует ли в данных единственное уникальное значение, отличное от NULL.
skewPop	Вычисляет коэффициент асимметрии для последовательности.
skewSamp	Вычисляет выборочный коэффициент асимметрии последовательности.
sparkbar	Функция строит гистограмму частоты для значений `x` и частоты повторения `y` этих значений на интервале `[min_x, max_x]`.
stddevPop	Результат равен квадратному корню из varPop.
stddevPopStable	Результат равен квадратному корню из varPop. В отличие от stddevPop, эта функция использует численно устойчивый алгоритм.
stddevSamp	Результат равен квадратному корню из значения varSamp
stddevSampStable	Результат равен квадратному корню от varSamp. В отличие от varSamp, эта функция использует численно устойчивый алгоритм.
stochasticLinearRegression	Эта функция реализует стохастическую линейную регрессию. Она поддерживает настраиваемые параметры скорости обучения, коэффициента L2‑регуляризации, размера мини‑батча и предоставляет несколько методов обновления весов (Adam, простой SGD, Momentum, Nesterov).
stochasticLogisticRegression	Эта функция реализует стохастическую логистическую регрессию. Её можно использовать для решения задач бинарной классификации; она поддерживает те же настраиваемые параметры, что и stochasticLinearRegression, и работает аналогичным образом.
studentTTest	Применяет t-критерий Стьюдента к выборкам из двух генеральных совокупностей.
sum	Вычисляет сумму. Применимо только к числам.
studentTTestOneSample	Применяет одновыборочный t‑критерий Стьюдента к выборке и известному среднему генеральной совокупности.
sumCount	Вычисляет сумму чисел и одновременно считает количество строк. Функция используется оптимизатором запросов ClickHouse: если в запросе присутствует несколько функций `sum`, `count` или `avg`, их можно заменить одной функцией `sumCount` для повторного использования результатов вычислений. Функцию редко требуется вызывать явно.
sumKahan	Вычисляет сумму чисел с использованием алгоритма компенсированного суммирования по Кахану
sumMap	Суммирует один или несколько массивов `value` по ключам, указанным в массиве `key`. Возвращает кортеж массивов: сначала ключи в отсортированном порядке, затем значения, суммированные для соответствующих ключей без переполнения.
sumMapWithOverflow	Вычисляет сумму элементов массива `value` в соответствии с ключами, заданными в массиве `key`. Возвращает кортеж из двух массивов: отсортированные ключи и суммы значений для соответствующих ключей. Отличается от функции sumMap тем, что выполняет суммирование с переполнением.
sumWithOverflow	Вычисляет сумму чисел, используя для результата тот же тип данных, что и для входных параметров. Если сумма превышает максимально допустимое значение для этого типа данных, она вычисляется с переполнением.
theilsU	Функция `theilsU` вычисляет коэффициент неопределённости U Тейла — величину, характеризующую степень связи между двумя столбцами в таблице.
topK	Возвращает массив приблизительно наиболее частых значений в указанном столбце. Полученный массив отсортирован по убыванию приблизительной частоты значений (а не по самим значениям).
topKWeighted	Возвращает массив примерно наиболее часто встречающихся значений в указанном столбце. Полученный массив отсортирован по убыванию оценочной частоты значений (не по самим значениям). Также учитывается вес значения.
uniq	Вычисляет примерное количество уникальных значений аргумента.
uniqCombined	Вычисляет примерное количество различных значений аргумента.
uniqCombined64	Вычисляет приблизительное количество различных значений аргумента. Аналогична uniqCombined, но использует 64-битный хеш для всех типов данных, а не только для типа String.
uniqExact	Вычисляет точное число различных значений аргументов.
uniqHLL12	Вычисляет приблизительное количество уникальных значений аргумента с помощью алгоритма HyperLogLog.
uniqTheta	Вычисляет приблизительное количество различных значений аргумента на основе фреймворка Theta Sketch.
varPop	Вычисляет дисперсию генеральной совокупности.
varPopStable	Возвращает генеральную дисперсию. В отличие от varPop эта функция использует численно устойчивый алгоритм. Работает медленнее, но обеспечивает меньшую вычислительную погрешность.
varSamp	Вычисляет выборочную дисперсию набора данных.
varSampStable	Вычисляет выборочную дисперсию набора данных. В отличие от `varSamp` эта функция использует численно устойчивый алгоритм. При этом работает медленнее, но обеспечивает меньшую вычислительную погрешность.
welchTTest	Применяет t‑критерий Уэлча к выборкам из двух генеральных совокупностей.
distinctDynamicTypes	Вычисляет список уникальных типов данных, хранящихся в столбце Dynamic.
distinctJSONPaths	Вычисляет список уникальных путей, хранящихся в JSON-столбце.
timeSeriesDeltaToGrid	Агрегирующая функция, вычисляющая PromQL‑подобную дельту над данными временных рядов на заданной сетке.
timeSeriesInstantDeltaToGrid	Агрегатная функция, вычисляющая idelta, аналогичный PromQL, для данных временных рядов на заданной сетке.
timeSeriesInstantRateToGrid	Агрегатная функция, вычисляющая PromQL-подобный irate для данных временных рядов на указанной сетке.
timeSeriesLastTwoSamples	Агрегатная функция для ресемплирования данных временных рядов при вычислении irate и idelta как в PromQL
timeSeriesRateToGrid	Агрегатная функция, вычисляющая PromQL‑подобный rate по данным временных рядов на заданной временной сетке.
timeSeriesResampleToGridWithStaleness	Агрегатная функция, выполняющая ресемплинг данных временных рядов на заданную сетку.
timeSeriesDerivToGrid	Агрегатная функция, вычисляющая производную по данным временных рядов в стиле PromQL на заданной сетке.
timeSeriesPredictLinearToGrid	Агрегатная функция, вычисляющая линейный прогноз в стиле PromQL по данным временных рядов на заданной временной сетке.
timeSeriesChangesToGrid	Агрегатная функция, вычисляющая изменения по данным временных рядов в стиле PromQL на заданной временной сетке.
timeSeriesResetsToGrid	Агрегатная функция, вычисляющая сбросы счётчиков в стиле PromQL по данным временных рядов на заданной сетке.
groupConcat	Вычисляет объединённую строку из группы строк, при необходимости разделённых указанным разделителем и, опционально, ограниченных максимальным количеством элементов.
quantilePrometheusHistogram	Вычисляет квантиль гистограммы с использованием линейной интерполяции.