Approx count unique values
Description
This is done using the HyperLogLog++ algorithm for cardinality estimation.
Usage
<Expr>$approx_n_unique()
Value
Expr
Examples
library("polars")
as_polars_df(iris[, 4:5])$
with_columns(count = pl$col("Species")$approx_n_unique())
#> shape: (150, 3)
#> ┌─────────────┬───────────┬───────┐
#> │ Petal.Width ┆ Species ┆ count │
#> │ --- ┆ --- ┆ --- │
#> │ f64 ┆ cat ┆ u32 │
#> ╞═════════════╪═══════════╪═══════╡
#> │ 0.2 ┆ setosa ┆ 3 │
#> │ 0.2 ┆ setosa ┆ 3 │
#> │ 0.2 ┆ setosa ┆ 3 │
#> │ 0.2 ┆ setosa ┆ 3 │
#> │ 0.2 ┆ setosa ┆ 3 │
#> │ … ┆ … ┆ … │
#> │ 2.3 ┆ virginica ┆ 3 │
#> │ 1.9 ┆ virginica ┆ 3 │
#> │ 2.0 ┆ virginica ┆ 3 │
#> │ 2.3 ┆ virginica ┆ 3 │
#> │ 1.8 ┆ virginica ┆ 3 │
#> └─────────────┴───────────┴───────┘