Interface GroupBy

Starts a new GroupBy operation.

interface GroupBy {
    "[inspect]"(): string;
    agg(...columns: pl.Expr[]): pl.DataFrame;
    agg(
        columns: Record<string, keyof pl.Expr | (keyof pl.Expr)[]>,
    ): pl.DataFrame;
    aggList(): pl.DataFrame;
    first(): pl.DataFrame;
    groups(): pl.DataFrame;
    head(n?: number): pl.DataFrame;
    last(): pl.DataFrame;
    len(): pl.DataFrame;
    max(): pl.DataFrame;
    mean(): pl.DataFrame;
    median(): pl.DataFrame;
    min(): pl.DataFrame;
    nUnique(): pl.DataFrame;
    pivot(pivotCol: string, valuesCol: string): PivotOps;
    pivot(__namedParameters: { pivotCol: string; valuesCol: string }): PivotOps;
    quantile(quantile: number): pl.DataFrame;
    sum(): pl.DataFrame;
    tail(n?: number): pl.DataFrame;
    toString(): string;
}

Index

Methods

[inspect] agg aggList first groups head last len max mean median min nUnique pivot quantile sum tail toString

Methods

[inspect]

"[inspect]"(): string
Returns string
- Defined in polars/groupby.ts:15

agg

agg(...columns: pl.Expr[]): pl.DataFrame
Use multiple aggregations on columns. This can be combined with complete lazy API and is considered idiomatic polars.
Parameters
- ...columns: pl.Expr[]
  map of 'col' -> 'agg'
  
  using lazy API (recommended): [col('foo').sum(), col('bar').min()]
  
  using multiple aggs per column: {'foo': ['sum', 'numUnique'], 'bar': ['min'] }
  
  using single agg per column: {'foo': ['sum'], 'bar': 'min' }
Returns pl.DataFrame
Example
```
// use lazy api rest parameter style
> df.groupBy('foo', 'bar')
>   .agg(pl.sum('ham'), col('spam').tail(4).sum())

// use lazy api array style
> df.groupBy('foo', 'bar')
>   .agg([pl.sum('ham'), col('spam').tail(4).sum()])

// use a mapping
> df.groupBy('foo', 'bar')
>   .agg({'spam': ['sum', 'min']})
```
- Defined in polars/groupby.ts:45
agg(columns: Record<string, keyof pl.Expr | (keyof pl.Expr)[]>): pl.DataFrame
Parameters
- columns: Record<string, keyof pl.Expr | (keyof pl.Expr)[]>
Returns pl.DataFrame
- Defined in polars/groupby.ts:46

aggList

aggList(): pl.DataFrame
Aggregate the groups into Series.

Returns pl.DataFrame
- Defined in polars/groupby.ts:19

first

first(): pl.DataFrame
Aggregate the first values in the group.

Returns pl.DataFrame
- Defined in polars/groupby.ts:54

groups

groups(): pl.DataFrame
Return a DataFrame with:
- the groupby keys
- the group indexes aggregated as lists
Returns pl.DataFrame
- Defined in polars/groupby.ts:61

head

head(n?: number): pl.DataFrame

Return first n rows of each group.

Parameters

Optionaln: number
Number of values of the group to select

Returns pl.DataFrame

Example

> df = pl.DataFrame({
>   "letters": ["c", "c", "a", "c", "a", "b"],
>   "nrs": [1, 2, 3, 4, 5, 6]
> })
> df
shape: (6, 2)
╭─────────┬─────╮
│ letters ┆ nrs │
│ ---     ┆ --- │
│ str     ┆ i64 │
╞═════════╪═════╡
│ "c"     ┆ 1   │
├╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌┤
│ "c"     ┆ 2   │
├╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌┤
│ "a"     ┆ 3   │
├╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌┤
│ "c"     ┆ 4   │
├╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌┤
│ "a"     ┆ 5   │
├╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌┤
│ "b"     ┆ 6   │
╰─────────┴─────╯
> df.groupby("letters")
>   .head(2)
>   .sort("letters");
> >>
shape: (5, 2)
╭─────────┬─────╮
│ letters ┆ nrs │
│ ---     ┆ --- │
│ str     ┆ i64 │
╞═════════╪═════╡
│ "a"     ┆ 3   │
├╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌┤
│ "a"     ┆ 5   │
├╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌┤
│ "b"     ┆ 6   │
├╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌┤
│ "c"     ┆ 1   │
├╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌┤
│ "c"     ┆ 2   │
╰─────────┴─────╯

last

last(): pl.DataFrame
Aggregate the last values in the group.

Returns pl.DataFrame
- Defined in polars/groupby.ts:116

len

len(): pl.DataFrame
Return the number of rows in each group.

Returns pl.DataFrame
- Defined in polars/groupby.ts:50

max

max(): pl.DataFrame
Reduce the groups to the maximal value.

Returns pl.DataFrame
- Defined in polars/groupby.ts:120

mean

mean(): pl.DataFrame
Reduce the groups to the mean values.

Returns pl.DataFrame
- Defined in polars/groupby.ts:124

median

median(): pl.DataFrame
Return the median per group.

Returns pl.DataFrame
- Defined in polars/groupby.ts:128

min

min(): pl.DataFrame
Reduce the groups to the minimal value.

Returns pl.DataFrame
- Defined in polars/groupby.ts:132

nUnique

nUnique(): pl.DataFrame
Count the unique values per group.

Returns pl.DataFrame
- Defined in polars/groupby.ts:136

pivot

pivot(pivotCol: string, valuesCol: string): PivotOps
Do a pivot operation based on the group key, a pivot column and an aggregation function on the values column.
Parameters
- pivotCol: string
  Column to pivot.
- valuesCol: string
  Column that will be aggregated.
Returns PivotOps
- Defined in polars/groupby.ts:143
pivot(__namedParameters: { pivotCol: string; valuesCol: string }): PivotOps
Parameters
- __namedParameters: { pivotCol: string; valuesCol: string }
Returns PivotOps
- Defined in polars/groupby.ts:144

quantile

quantile(quantile: number): pl.DataFrame
Compute the quantile per group.
Parameters
- quantile: number
Returns pl.DataFrame
- Defined in polars/groupby.ts:154

sum

sum(): pl.DataFrame
Reduce the groups to the sum.

Returns pl.DataFrame
- Defined in polars/groupby.ts:158

tail

tail(n?: number): pl.DataFrame
Parameters
- Optionaln: number
Returns pl.DataFrame
- Defined in polars/groupby.ts:159

toString

toString(): string
Returns string
- Defined in polars/groupby.ts:160

Interface GroupBy

Index

Methods

Methods

[inspect]

Returns string

agg

Parameters

Returns pl.DataFrame

Example

Parameters

Returns pl.DataFrame

aggList

Returns pl.DataFrame

first

Returns pl.DataFrame

groups

Returns pl.DataFrame

head

Parameters

Returns pl.DataFrame

Example

last

Returns pl.DataFrame

len

Returns pl.DataFrame

max

Returns pl.DataFrame

mean

Returns pl.DataFrame

median

Returns pl.DataFrame

min

Returns pl.DataFrame

nUnique

Returns pl.DataFrame

pivot

Parameters

Returns PivotOps

Parameters

Returns PivotOps

quantile

Parameters

Returns pl.DataFrame

sum

Returns pl.DataFrame

tail

Parameters

Returns pl.DataFrame

toString

Returns string

Settings

On This Page