Interface LazyDataFrame

Representation of a Lazy computation graph / query.

interface LazyDataFrame {
    "[inspect]"(): string;
    "[toStringTag]": string;
    cache(): LazyDataFrame;
    clone(): LazyDataFrame;
    collect(opts?: LazyOptions): Promise<pl.DataFrame<any>>;
    collectSync(opts?: LazyOptions): pl.DataFrame;
    get columns(): string[];
    describeOptimizedPlan(opts?: LazyOptions): string;
    describePlan(): string;
    drop(name: string): LazyDataFrame;
    drop(names: string[]): LazyDataFrame;
    drop(name: string, ...names: string[]): LazyDataFrame;
    dropNulls(column: string): LazyDataFrame;
    dropNulls(columns: string[]): LazyDataFrame;
    dropNulls(...columns: string[]): LazyDataFrame;
    explode(column: ExprOrString): LazyDataFrame;
    explode(columns: ExprOrString[]): LazyDataFrame;
    explode(column: ExprOrString, ...columns: ExprOrString[]): LazyDataFrame;
    fetch(numRows: number, opts: LazyOptions): Promise<pl.DataFrame<any>>;
    fetch(numRows?: number): Promise<pl.DataFrame<any>>;
    fetchSync(numRows?: number): pl.DataFrame;
    fetchSync(numRows: number, opts: LazyOptions): pl.DataFrame;
    fillNull(fillValue: string | number | pl.Expr): LazyDataFrame;
    filter(predicate: string | pl.Expr): LazyDataFrame;
    first(): pl.DataFrame;
    groupBy(by: ColumnsOrExpr, maintainOrder?: boolean): LazyGroupBy;
    groupBy(by: ColumnsOrExpr, opts: { maintainOrder: boolean }): LazyGroupBy;
    groupByDynamic(
        options: {
            by?: ColumnsOrExpr;
            closed?: "none" | "left" | "right" | "both";
            every: string;
            includeBoundaries?: boolean;
            indexColumn: string;
            label?: string;
            offset?: string;
            period?: string;
            startBy?: StartBy;
        },
    ): LazyGroupBy;
    groupByRolling(
        opts: {
            by?: ColumnsOrExpr;
            closed?: "none" | "left" | "right" | "both";
            indexColumn: ColumnsOrExpr;
            offset?: string;
            period: string;
        },
    ): LazyGroupBy;
    head(length?: number): LazyDataFrame;
    inner(): any;
    join(
        other: LazyDataFrame,
        joinOptions: { on: ValueOrArray<string | pl.Expr> } & LazyJoinOptions,
    ): LazyDataFrame;
    join(
        other: LazyDataFrame,
        joinOptions: {
            leftOn: ValueOrArray<string | pl.Expr>;
            rightOn: ValueOrArray<string | pl.Expr>;
        } & LazyJoinOptions,
    ): LazyDataFrame;
    join(
        other: LazyDataFrame,
        options: {
            allowParallel?: boolean;
            forceParallel?: boolean;
            how: "cross";
            suffix?: string;
        },
    ): LazyDataFrame;
    joinAsof(
        other: LazyDataFrame,
        options: {
            allowParallel?: boolean;
            by?: string | string[];
            byLeft?: string | string[];
            byRight?: string | string[];
            forceParallel?: boolean;
            leftOn?: string;
            on?: string;
            rightOn?: string;
            strategy?: "backward" | "forward" | "nearest";
            suffix?: string;
            tolerance?: string | number;
        },
    ): LazyDataFrame;
    last(): LazyDataFrame;
    limit(n?: number): LazyDataFrame;
    max(): LazyDataFrame;
    mean(): LazyDataFrame;
    median(): LazyDataFrame;
    melt(idVars: ColumnSelection, valueVars: ColumnSelection): LazyDataFrame;
    min(): LazyDataFrame;
    quantile(quantile: number): LazyDataFrame;
    rename(mapping: Record<string, string>): LazyDataFrame;
    reverse(): LazyDataFrame;
    select(column: ExprOrString): LazyDataFrame;
    select(columns: ExprOrString[]): LazyDataFrame;
    select(...columns: ExprOrString[]): LazyDataFrame;
    serialize(format: "json" | "bincode"): Buffer;
    shift(periods: number): LazyDataFrame;
    shift(opts: { periods: number }): LazyDataFrame;
    shiftAndFill(n: number, fillValue: number): LazyDataFrame;
    shiftAndFill(opts: { fillValue: number; n: number }): LazyDataFrame;
    sinkCSV(path: string, options?: CsvWriterOptions): void;
    sinkParquet(path: string, options?: SinkParquetOptions): void;
    slice(offset: number, length: number): LazyDataFrame;
    slice(opts: { length: number; offset: number }): LazyDataFrame;
    sort(
        by: ColumnsOrExpr,
        descending?: ValueOrArray<boolean>,
        nullsLast?: boolean,
        maintainOrder?: boolean,
    ): LazyDataFrame;
    sort(
        opts: {
            by: ColumnsOrExpr;
            descending?: ValueOrArray<boolean>;
            maintainOrder?: boolean;
            nullsLast?: boolean;
        },
    ): LazyDataFrame;
    std(): LazyDataFrame;
    sum(): LazyDataFrame;
    tail(length?: number): LazyDataFrame;
    toJSON(): string;
    unique(
        maintainOrder?: boolean,
        subset?: ColumnSelection,
        keep?: "first" | "last",
    ): LazyDataFrame;
    unique(
        opts: {
            keep?: "first" | "last";
            maintainOrder?: boolean;
            subset?: ColumnSelection;
        },
    ): LazyDataFrame;
    unpivot(
        idVars: ColumnSelection,
        valueVars: ColumnSelection,
        options?: { valueName?: null | string; variableName?: null | string },
    ): LazyDataFrame;
    var(): LazyDataFrame;
    withColumn(expr: pl.Expr): LazyDataFrame;
    withColumnRenamed(existing: string, replacement: string): LazyDataFrame;
    withColumns(exprs: (pl.Expr | pl.Series<any, string>)[]): LazyDataFrame;
    withColumns(...exprs: (pl.Expr | pl.Series<any, string>)[]): LazyDataFrame;
    withRowCount(): LazyDataFrame;
}

Hierarchy

Serialize
GroupByOps<LazyGroupBy>
- LazyDataFrame

Properties

[toStringTag]

"[toStringTag]": string

Accessors

columns

get columns(): string[]
Returns string[]
- Defined in polars/lazy/dataframe.ts:32

Methods

[inspect]

"[inspect]"(): string
Returns string
- Defined in polars/lazy/dataframe.ts:30

cache

cache(): LazyDataFrame
Cache the result once the execution of the physical plan hits this node.

Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:36

clone

clone(): LazyDataFrame
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:37

collect

collect(opts?: LazyOptions): Promise<pl.DataFrame<any>>
Collect into a DataFrame. Note: use fetch if you want to run this query on the first n rows only. This can be a huge time saver in debugging queries.
Parameters
- Optionalopts: LazyOptions
  options for lazy operations
  - OptionalcommSubexprElim?: boolean
  - OptionalcommSubplanElim?: boolean
  - OptionalnoOptimization?: boolean
  - OptionalpredicatePushdown?: boolean
  - OptionalprojectionPushdown?: boolean
  - OptionalsimplifyExpression?: boolean
  - OptionalslicePushdown?: boolean
  - Optionalstreaming?: boolean
  - OptionaltypeCoercion?: boolean
Returns Promise<pl.DataFrame<any>>
DataFrame
- Defined in polars/lazy/dataframe.ts:60

collectSync

collectSync(opts?: LazyOptions): pl.DataFrame
Parameters
- Optionalopts: LazyOptions
Returns pl.DataFrame
- Defined in polars/lazy/dataframe.ts:61

describeOptimizedPlan

describeOptimizedPlan(opts?: LazyOptions): string
A string representation of the optimized query plan.
Parameters
- Optionalopts: LazyOptions
Returns string
- Defined in polars/lazy/dataframe.ts:65

describePlan

describePlan(): string
A string representation of the unoptimized query plan.

Returns string
- Defined in polars/lazy/dataframe.ts:69

drop

drop(name: string): LazyDataFrame
Remove one or multiple columns from a DataFrame.
Parameters
- name: string
  column or list of columns to be removed
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:74
drop(names: string[]): LazyDataFrame
Parameters
- names: string[]
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:75
drop(name: string, ...names: string[]): LazyDataFrame
Parameters
- name: string
- ...names: string[]
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:76

dropNulls

dropNulls(column: string): LazyDataFrame
Drop rows with null values from this DataFrame. This method only drops nulls row-wise if any single value of the row is null.
Parameters
- column: string
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:81
dropNulls(columns: string[]): LazyDataFrame
Parameters
- columns: string[]
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:82
dropNulls(...columns: string[]): LazyDataFrame
Parameters
- ...columns: string[]
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:83

explode

explode(column: ExprOrString): LazyDataFrame
Explode lists to long format.
Parameters
- column: ExprOrString
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:87
explode(columns: ExprOrString[]): LazyDataFrame
Parameters
- columns: ExprOrString[]
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:88
explode(column: ExprOrString, ...columns: ExprOrString[]): LazyDataFrame
Parameters
- column: ExprOrString
- ...columns: ExprOrString[]
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:89

fetch

fetch(numRows: number, opts: LazyOptions): Promise<pl.DataFrame<any>>
Fetch is like a collect operation, but it overwrites the number of rows read by every scan

Note that the fetch does not guarantee the final number of rows in the DataFrame. Filter, join operations and a lower number of rows available in the scanned file influence the final number of rows.
Parameters
- numRows: number
  collect 'n' number of rows from data source
- opts: LazyOptions
  options for lazy operations
  - OptionalcommSubexprElim?: boolean
  - OptionalcommSubplanElim?: boolean
  - OptionalnoOptimization?: boolean
  - OptionalpredicatePushdown?: boolean
  - OptionalprojectionPushdown?: boolean
  - OptionalsimplifyExpression?: boolean
  - OptionalslicePushdown?: boolean
  - Optionalstreaming?: boolean
  - OptionaltypeCoercion?: boolean
Returns Promise<pl.DataFrame<any>>
- Defined in polars/lazy/dataframe.ts:112
fetch(numRows?: number): Promise<pl.DataFrame<any>>
Parameters
- OptionalnumRows: number
Returns Promise<pl.DataFrame<any>>
- Defined in polars/lazy/dataframe.ts:113

fetchSync

fetchSync(numRows?: number): pl.DataFrame
Behaves the same as fetch, but will perform the actions synchronously
Parameters
- OptionalnumRows: number
Returns pl.DataFrame
- Defined in polars/lazy/dataframe.ts:115
fetchSync(numRows: number, opts: LazyOptions): pl.DataFrame
Parameters
- numRows: number
- opts: LazyOptions
Returns pl.DataFrame
- Defined in polars/lazy/dataframe.ts:116

fillNull

fillNull(fillValue: string | number | pl.Expr): LazyDataFrame
Fill missing values
Parameters
- fillValue: string | number | pl.Expr
  value to fill the missing values with
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:121

filter

filter(predicate: string | pl.Expr): LazyDataFrame

Filter the rows in the DataFrame based on a predicate expression.

Parameters

predicate: string | pl.Expr
Expression that evaluates to a boolean Series.

Returns LazyDataFrame

Example

> lf = pl.DataFrame({
>   "foo": [1, 2, 3],
>   "bar": [6, 7, 8],
>   "ham": ['a', 'b', 'c']
> }).lazy()
> // Filter on one condition
> lf.filter(pl.col("foo").lt(3)).collect()
shape: (2, 3)
┌─────┬─────┬─────┐
│ foo ┆ bar ┆ ham │
│ --- ┆ --- ┆ --- │
│ i64 ┆ i64 ┆ str │
╞═════╪═════╪═════╡
│ 1   ┆ 6   ┆ a   │
├╌╌╌╌╌┼╌╌╌╌╌┼╌╌╌╌╌┤
│ 2   ┆ 7   ┆ b   │
└─────┴─────┴─────┘

first

first(): pl.DataFrame
Get the first row of the DataFrame.

Returns pl.DataFrame
- Defined in polars/lazy/dataframe.ts:150

groupBy

groupBy(by: ColumnsOrExpr, maintainOrder?: boolean): LazyGroupBy
Start a groupby operation.
Parameters
- by: ColumnsOrExpr
- OptionalmaintainOrder: boolean
Returns LazyGroupBy
- Defined in polars/lazy/dataframe.ts:154
groupBy(by: ColumnsOrExpr, opts: { maintainOrder: boolean }): LazyGroupBy
Parameters
- by: ColumnsOrExpr
- opts: { maintainOrder: boolean }
Returns LazyGroupBy
- Defined in polars/lazy/dataframe.ts:155

groupByDynamic

groupByDynamic(
    options: {
        by?: ColumnsOrExpr;
        closed?: "none" | "left" | "right" | "both";
        every: string;
        includeBoundaries?: boolean;
        indexColumn: string;
        label?: string;
        offset?: string;
        period?: string;
        startBy?: StartBy;
    },
): LazyGroupBy
Groups based on a time value (or index value of type Int32, Int64). Time windows are calculated and rows are assigned to windows. Different from a normal groupby is that a row can be member of multiple groups. The time/index window could be seen as a rolling window, with a window size determined by dates/times/values instead of slots in the DataFrame.

A window is defined by:
- every: interval of the window
- period: length of the window
- offset: offset of the window
The every, period and offset arguments are created with the following string language:
- 1ns (1 nanosecond)
- 1us (1 microsecond)
- 1ms (1 millisecond)
- 1s (1 second)
- 1m (1 minute)
- 1h (1 hour)
- 1d (1 day)
- 1w (1 week)
- 1mo (1 calendar month)
- 1y (1 calendar year)
- 1i (1 index count)
Or combine them: "3d12h4m25s" # 3 days, 12 hours, 4 minutes, and 25 seconds

In case of a groupbyDynamic on an integer column, the windows are defined by:
- "1i" # length 1
- "10i" # length 10
Parameters
Parameters
- options: {
      by?: ColumnsOrExpr;
      closed?: "none" | "left" | "right" | "both";
      every: string;
      includeBoundaries?: boolean;
      indexColumn: string;
      label?: string;
      offset?: string;
      period?: string;
      startBy?: StartBy;
  }
  - Optionalby?: ColumnsOrExpr
    Also group by this column/these columns
  - Optionalclosed?: "none" | "left" | "right" | "both"
    Defines if the window interval is closed or not. Any of {"left", "right", "both" "none"}
  - every: string
    interval of the window
  - OptionalincludeBoundaries?: boolean
    add the lower and upper bound of the window to the "_lower_bound" and "_upper_bound" columns. This will impact performance because it's harder to parallelize
  - indexColumn: string
    Column used to group based on the time window. Often to type Date/Datetime This column must be sorted in ascending order. If not the output will not make sense.
    
    In case of a dynamic groupby on indices, dtype needs to be one of {Int32, Int64}. Note that Int32 gets temporarily cast to Int64, so if performance matters use an Int64 column.
  - Optionallabel?: string
    Define which label to use for the window: Any if {'left', 'right', 'datapoint'}
  - Optionaloffset?: string
    offset of the window if None and period is None it will be equal to negative every
  - Optionalperiod?: string
    length of the window, if None it is equal to 'every'
  - OptionalstartBy?: StartBy
    The strategy to determine the start of the first window by. Any of {'window', 'datapoint', 'monday', 'tuesday', 'wednesday', 'thursday', 'friday', 'saturday', 'sunday'}
Returns LazyGroupBy
Inherited from GroupByOps.groupByDynamic
- Defined in polars/shared_traits.ts:1199

groupByRolling

groupByRolling(
    opts: {
        by?: ColumnsOrExpr;
        closed?: "none" | "left" | "right" | "both";
        indexColumn: ColumnsOrExpr;
        offset?: string;
        period: string;
    },
): LazyGroupBy

Create rolling groups based on a time column (or index value of type Int32, Int64).

Different from a rolling groupby the windows are now determined by the individual values and are not of constant intervals. For constant intervals use groupByDynamic

The period and offset arguments are created with the following string language:

1ns (1 nanosecond)
1us (1 microsecond)
1ms (1 millisecond)
1s (1 second)
1m (1 minute)
1h (1 hour)
1d (1 day)
1w (1 week)
1mo (1 calendar month)
1y (1 calendar year)
1i (1 index count)

Or combine them: "3d12h4m25s" # 3 days, 12 hours, 4 minutes, and 25 seconds

In case of a groupby_rolling on an integer column, the windows are defined by:

"1i" # length 1
"10i" # length 10

Parameters

opts: {
    by?: ColumnsOrExpr;
    closed?: "none" | "left" | "right" | "both";
    indexColumn: ColumnsOrExpr;
    offset?: string;
    period: string;
}
- Optionalby?: ColumnsOrExpr
  Also group by this column/these columns
- Optionalclosed?: "none" | "left" | "right" | "both"
  Defines if the window interval is closed or not. Any of {"left", "right", "both" "none"}
- indexColumn: ColumnsOrExpr
  Column used to group based on the time window. Often to type Date/Datetime This column must be sorted in ascending order. If not the output will not make sense.
  
  In case of a rolling groupby on indices, dtype needs to be one of {Int32, Int64}. Note that Int32 gets temporarily cast to Int64, so if performance matters use an Int64 column.
- Optionaloffset?: string
  offset of the window. Default is -period
- period: string
  length of the window

Returns LazyGroupBy

Example


>dates = [
...     "2020-01-01 13:45:48",
...     "2020-01-01 16:42:13",
...     "2020-01-01 16:45:09",
...     "2020-01-02 18:12:48",
...     "2020-01-03 19:45:32",
...     "2020-01-08 23:16:43",
... ]
>df = pl.DataFrame({"dt": dates, "a": [3, 7, 5, 9, 2, 1]}).withColumn(
...     pl.col("dt").str.strptime(pl.Datetime)
... )
>out = df.groupbyRolling({indexColumn:"dt", period:"2d"}).agg(
...     [
...         pl.sum("a").alias("sum_a"),
...         pl.min("a").alias("min_a"),
...         pl.max("a").alias("max_a"),
...     ]
... )
>assert(out["sum_a"].toArray() === [3, 10, 15, 24, 11, 1])
>assert(out["max_a"].toArray() === [3, 7, 7, 9, 9, 1])
>assert(out["min_a"].toArray() === [3, 3, 3, 3, 2, 1])
>out
shape: (6, 4)
┌─────────────────────┬───────┬───────┬───────┐
│ dt                  ┆ a_sum ┆ a_max ┆ a_min │
│ ---                 ┆ ---   ┆ ---   ┆ ---   │
│ datetime[ms]        ┆ i64   ┆ i64   ┆ i64   │
╞═════════════════════╪═══════╪═══════╪═══════╡
│ 2020-01-01 13:45:48 ┆ 3     ┆ 3     ┆ 3     │
├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┤
│ 2020-01-01 16:42:13 ┆ 10    ┆ 7     ┆ 3     │
├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┤
│ 2020-01-01 16:45:09 ┆ 15    ┆ 7     ┆ 3     │
├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┤
│ 2020-01-02 18:12:48 ┆ 24    ┆ 9     ┆ 3     │
├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┤
│ 2020-01-03 19:45:32 ┆ 11    ┆ 9     ┆ 2     │
├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌┤
│ 2020-01-08 23:16:43 ┆ 1     ┆ 1     ┆ 1     │
└─────────────────────┴───────┴───────┴───────┘

head

head(length?: number): LazyDataFrame
Gets the first n rows of the DataFrame. You probably don't want to use this!

Consider using the fetch operation. The fetch operation will truly load the first nrows lazily.
Parameters
- Optionallength: number
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:163

inner

inner(): any
Returns any
- Defined in polars/lazy/dataframe.ts:164

join

join(
other: LazyDataFrame,
joinOptions: { on: ValueOrArray<string | pl.Expr> } & LazyJoinOptions,
): LazyDataFrame

SQL like joins.

Parameters

other: LazyDataFrame
DataFrame to join with.
joinOptions: { on: ValueOrArray<string | pl.Expr> } & LazyJoinOptions
- on: ValueOrArray<string | pl.Expr>
  Name(s) of the join columns in both DataFrames.
options for lazy join operations
- OptionalallowParallel?: boolean
- OptionalforceParallel?: boolean
- Optionalhow?: JoinType
  join type
- OptionalleftOn?: string | string[]
  left join column
- Optionalon?: string | string[]
  left and right join column
- OptionalrightOn?: string | string[]
  right join column
- Optionalsuffix?: string

Returns LazyDataFrame

See

LazyJoinOptions

Example

>>> const df = pl.DataFrame({
>>>     foo: [1, 2, 3],
>>>     bar: [6.0, 7.0, 8.0],
>>>     ham: ['a', 'b', 'c'],
>>>   }).lazy()
>>>
>>> const otherDF = pl.DataFrame({
>>>     apple: ['x', 'y', 'z'],
>>>     ham: ['a', 'b', 'd'],
>>>   }).lazy();
>>> const result = await df.join(otherDF, { on: 'ham', how: 'inner' }).collect();
shape: (2, 4)
╭─────┬─────┬─────┬───────╮
│ foo ┆ bar ┆ ham ┆ apple │
│ --- ┆ --- ┆ --- ┆ ---   │
│ i64 ┆ f64 ┆ str ┆ str   │
╞═════╪═════╪═════╪═══════╡
│ 1   ┆ 6   ┆ "a" ┆ "x"   │
├╌╌╌╌╌┼╌╌╌╌╌┼╌╌╌╌╌┼╌╌╌╌╌╌╌┤
│ 2   ┆ 7   ┆ "b" ┆ "y"   │
╰─────┴─────┴─────┴───────╯

join(
    other: LazyDataFrame,
    joinOptions: {
        leftOn: ValueOrArray<string | pl.Expr>;
        rightOn: ValueOrArray<string | pl.Expr>;
    } & LazyJoinOptions,
): LazyDataFrame
Parameters
- other: LazyDataFrame
- joinOptions: {
  leftOn: ValueOrArray<string | pl.Expr>;
  rightOn: ValueOrArray<string | pl.Expr>;
  } & LazyJoinOptions
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:205
join(
    other: LazyDataFrame,
    options: {
        allowParallel?: boolean;
        forceParallel?: boolean;
        how: "cross";
        suffix?: string;
    },
): LazyDataFrame
Parameters
- other: LazyDataFrame
- options: {
      allowParallel?: boolean;
      forceParallel?: boolean;
      how: "cross";
      suffix?: string;
  }
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:212

joinAsof

joinAsof(
    other: LazyDataFrame,
    options: {
        allowParallel?: boolean;
        by?: string | string[];
        byLeft?: string | string[];
        byRight?: string | string[];
        forceParallel?: boolean;
        leftOn?: string;
        on?: string;
        rightOn?: string;
        strategy?: "backward" | "forward" | "nearest";
        suffix?: string;
        tolerance?: string | number;
    },
): LazyDataFrame
Perform an asof join. This is similar to a left-join except that we match on nearest key rather than equal keys.

Both DataFrames must be sorted by the asof_join key.

For each row in the left DataFrame:
- A "backward" search selects the last row in the right DataFrame whose 'on' key is less than or equal to the left's key.
- A "forward" search selects the first row in the right DataFrame whose 'on' key is greater than or equal to the left's key.
- A "nearest" search selects the last row in the right DataFrame whose value is nearest to the left's key. String keys are not currently supported for a nearest search.
The default is "backward".

Parameters
Parameters
- other: LazyDataFrame
  DataFrame to join with.
- options: {
      allowParallel?: boolean;
      by?: string | string[];
      byLeft?: string | string[];
      byRight?: string | string[];
      forceParallel?: boolean;
      leftOn?: string;
      on?: string;
      rightOn?: string;
      strategy?: "backward" | "forward" | "nearest";
      suffix?: string;
      tolerance?: string | number;
  }
  - OptionalallowParallel?: boolean
    Allow the physical plan to optionally evaluate the computation of both DataFrames up to the join in parallel.
  - Optionalby?: string | string[]
  - OptionalbyLeft?: string | string[]
    join on these columns before doing asof join
  - OptionalbyRight?: string | string[]
    join on these columns before doing asof join
  - OptionalforceParallel?: boolean
    Force the physical plan to evaluate the computation of both DataFrames up to the join in parallel.
  - OptionalleftOn?: string
    Join column of the left DataFrame.
  - Optionalon?: string
    Join column of both DataFrames. If set, leftOn and rightOn should be undefined.
  - OptionalrightOn?: string
    Join column of the right DataFrame.
  - Optionalstrategy?: "backward" | "forward" | "nearest"
    One of {'forward', 'backward', 'nearest'}
  - Optionalsuffix?: string
    Suffix to append to columns with a duplicate name.
  - Optionaltolerance?: string | number
    Numeric tolerance. By setting this the join will only be done if the near keys are within this distance. If an asof join is done on columns of dtype "Date", "Datetime" you use the following string language:
    
    1ns (1 nanosecond)
    
    1us (1 microsecond)
    
    1ms (1 millisecond)
    
    1s (1 second)
    
    1m (1 minute)
    
    1h (1 hour)
    
    1d (1 day)
    
    1w (1 week)
    
    1mo (1 calendar month)
    
    1y (1 calendar year)
    
    1i (1 index count)
    
    Or combine them:
    
    "3d12h4m25s" # 3 days, 12 hours, 4 minutes, and 25 seconds
Returns LazyDataFrame
Example
```
 >const gdp = pl.DataFrame({
 ...   date: [
 ...     new Date('2016-01-01'),
 ...     new Date('2017-01-01'),
 ...     new Date('2018-01-01'),
 ...     new Date('2019-01-01'),
 ...   ],  // note record date: Jan 1st (sorted!)
 ...   gdp: [4164, 4411, 4566, 4696],
 ... })
 >const population = pl.DataFrame({
 ...   date: [
 ...     new Date('2016-05-12'),
 ...     new Date('2017-05-12'),
 ...     new Date('2018-05-12'),
 ...     new Date('2019-05-12'),
 ...   ],  // note record date: May 12th (sorted!)
 ...   "population": [82.19, 82.66, 83.12, 83.52],
 ... })
 >population.joinAsof(
 ...   gdp,
 ...   {leftOn:"date", rightOn:"date", strategy:"backward"}
 ... )
   shape: (4, 3)
   ┌─────────────────────┬────────────┬──────┐
   │ date                ┆ population ┆ gdp  │
   │ ---                 ┆ ---        ┆ ---  │
   │ datetime[μs]        ┆ f64        ┆ i64  │
   ╞═════════════════════╪════════════╪══════╡
   │ 2016-05-12 00:00:00 ┆ 82.19      ┆ 4164 │
   ├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌┤
   │ 2017-05-12 00:00:00 ┆ 82.66      ┆ 4411 │
   ├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌┤
   │ 2018-05-12 00:00:00 ┆ 83.12      ┆ 4566 │
   ├╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌┤
   │ 2019-05-12 00:00:00 ┆ 83.52      ┆ 4696 │
   └─────────────────────┴────────────┴──────┘
```
- Defined in polars/lazy/dataframe.ts:315

last

last(): LazyDataFrame
Get the last row of the DataFrame.

Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:334

limit

limit(n?: number): LazyDataFrame
Parameters
- Optionaln: number
Returns LazyDataFrame
See
head
- Defined in polars/lazy/dataframe.ts:338

melt

melt(idVars: ColumnSelection, valueVars: ColumnSelection): LazyDataFrame
Parameters
- idVars: ColumnSelection
- valueVars: ColumnSelection
Returns LazyDataFrame
See
DataFrame.unpivot
- Defined in polars/lazy/dataframe.ts:354

min

min(): LazyDataFrame
Returns LazyDataFrame
See
DataFrame.min
- Defined in polars/lazy/dataframe.ts:369

quantile

quantile(quantile: number): LazyDataFrame
Parameters
- quantile: number
Returns LazyDataFrame
See
DataFrame.quantile
- Defined in polars/lazy/dataframe.ts:373

rename

rename(mapping: Record<string, string>): LazyDataFrame
Parameters
- mapping: Record<string, string>
Returns LazyDataFrame
See
DataFrame.rename
- Defined in polars/lazy/dataframe.ts:377

reverse

reverse(): LazyDataFrame
Reverse the DataFrame.

Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:381

select

select(column: ExprOrString): LazyDataFrame
Parameters
- column: ExprOrString
Returns LazyDataFrame
See
DataFrame.select
- Defined in polars/lazy/dataframe.ts:385
select(columns: ExprOrString[]): LazyDataFrame
Parameters
- columns: ExprOrString[]
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:386
select(...columns: ExprOrString[]): LazyDataFrame
Parameters
- ...columns: ExprOrString[]
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:387

serialize

serialize(format: "json" | "bincode"): Buffer
Serializes object to desired format via serde
Parameters
- format: "json" | "bincode"
  json | bincode
Returns Buffer
Inherited from Serialize.serialize
- Defined in polars/shared_traits.ts:1037

shift

shift(periods: number): LazyDataFrame
Parameters
- periods: number
Returns LazyDataFrame
See
DataFrame.shift
- Defined in polars/lazy/dataframe.ts:391
shift(opts: { periods: number }): LazyDataFrame
Parameters
- opts: { periods: number }
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:392

shiftAndFill

shiftAndFill(n: number, fillValue: number): LazyDataFrame
Parameters
- n: number
- fillValue: number
Returns LazyDataFrame
See
DataFrame.shiftAndFill
- Defined in polars/lazy/dataframe.ts:396
shiftAndFill(opts: { fillValue: number; n: number }): LazyDataFrame
Parameters
- opts: { fillValue: number; n: number }
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:397

sinkCSV

sinkCSV(path: string, options?: CsvWriterOptions): void
Evaluate the query in streaming mode and write to a CSV file.

.. warning:: Streaming mode is considered unstable. It may be changed at any point without it being considered a breaking change.

This allows streaming results that are larger than RAM to be written to disk.

Parameters
Parameters
- path: string
  File path to which the file should be written.
- Optionaloptions: CsvWriterOptions
  Options for
  - OptionalbatchSize?: number
  - OptionaldateFormat?: string
  - OptionaldatetimeFormat?: string
  - OptionalfloatPrecision?: number
  - OptionalincludeBom?: boolean
  - OptionalincludeHeader?: boolean
  - OptionallineTerminator?: string
  - OptionalmaintainOrder?: boolean
  - OptionalnullValue?: string
  - OptionalquoteChar?: string
  - Optionalseparator?: string
  - OptionaltimeFormat?: string
Returns void
- Defined in polars/lazy/dataframe.ts:518

sinkParquet

sinkParquet(path: string, options?: SinkParquetOptions): void
Evaluate the query in streaming mode and write to a Parquet file.

.. warning:: Streaming mode is considered unstable. It may be changed at any point without it being considered a breaking change.

This allows streaming results that are larger than RAM to be written to disk.

Parameters
Parameters
- path: string
  File path to which the file should be written.
- Optionaloptions: SinkParquetOptions
  Options for
  - OptionalcloudOptions?: Map<string, string>
  - Optionalcompression?: string
  - OptionalcompressionLevel?: number
  - OptionaldataPagesizeLimit?: number
  - OptionalmaintainOrder?: boolean
  - OptionalnoOptimization?: boolean
  - OptionalpredicatePushdown?: boolean
  - OptionalprojectionPushdown?: boolean
  - Optionalretries?: number
  - OptionalrowGroupSize?: number
  - OptionalsimplifyExpression?: boolean
  - OptionalslicePushdown?: boolean
  - Optionalstatistics?: boolean
  - OptionaltypeCoercion?: boolean
Returns void
- Defined in polars/lazy/dataframe.ts:573

slice

slice(offset: number, length: number): LazyDataFrame
Parameters
- offset: number
- length: number
Returns LazyDataFrame
See
DataFrame.slice
- Defined in polars/lazy/dataframe.ts:404
slice(opts: { length: number; offset: number }): LazyDataFrame
Parameters
- opts: { length: number; offset: number }
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:405

sort

sort(
    by: ColumnsOrExpr,
    descending?: ValueOrArray<boolean>,
    nullsLast?: boolean,
    maintainOrder?: boolean,
): LazyDataFrame
Parameters
- by: ColumnsOrExpr
- Optionaldescending: ValueOrArray<boolean>
- OptionalnullsLast: boolean
- OptionalmaintainOrder: boolean
Returns LazyDataFrame
See
DataFrame.sort
- Defined in polars/lazy/dataframe.ts:409
sort(
    opts: {
        by: ColumnsOrExpr;
        descending?: ValueOrArray<boolean>;
        maintainOrder?: boolean;
        nullsLast?: boolean;
    },
): LazyDataFrame
Parameters
- opts: {
      by: ColumnsOrExpr;
      descending?: ValueOrArray<boolean>;
      maintainOrder?: boolean;
      nullsLast?: boolean;
  }
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:415

std

std(): LazyDataFrame
Returns LazyDataFrame
See
DataFrame.std
- Defined in polars/lazy/dataframe.ts:424

sum

sum(): LazyDataFrame
Aggregate the columns in the DataFrame to their sum value.

Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:428

tail

tail(length?: number): LazyDataFrame
Get the last n rows of the DataFrame.
Parameters
- Optionallength: number
Returns LazyDataFrame
See
DataFrame.tail
- Defined in polars/lazy/dataframe.ts:433

toJSON

toJSON(): string
compatibility with JSON.stringify

Returns string
- Defined in polars/lazy/dataframe.ts:437

unique

unique(
    maintainOrder?: boolean,
    subset?: ColumnSelection,
    keep?: "first" | "last",
): LazyDataFrame
Drop duplicate rows from this DataFrame. Note that this fails if there is a column of type List in the DataFrame.
Parameters
- OptionalmaintainOrder: boolean
- Optionalsubset: ColumnSelection
  subset to drop duplicates for
- Optionalkeep: "first" | "last"
  "first" | "last"
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:445
unique(
    opts: {
        keep?: "first" | "last";
        maintainOrder?: boolean;
        subset?: ColumnSelection;
    },
): LazyDataFrame
Parameters
- opts: { keep?: "first" | "last"; maintainOrder?: boolean; subset?: ColumnSelection }
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:450

unpivot

unpivot(
    idVars: ColumnSelection,
    valueVars: ColumnSelection,
    options?: { valueName?: null | string; variableName?: null | string },
): LazyDataFrame
Parameters
- idVars: ColumnSelection
- valueVars: ColumnSelection
- Optionaloptions: { valueName?: null | string; variableName?: null | string }
Returns LazyDataFrame
See
DataFrame.unpivot
- Defined in polars/lazy/dataframe.ts:358

var

var(): LazyDataFrame
Aggregate the columns in the DataFrame to their variance value.

Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:458

withColumn

withColumn(expr: pl.Expr): LazyDataFrame
Add or overwrite column in a DataFrame.
Parameters
- expr: pl.Expr
  Expression that evaluates to column.
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:463

withColumnRenamed

withColumnRenamed(existing: string, replacement: string): LazyDataFrame
Parameters
- existing: string
- replacement: string
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:471

withColumns

withColumns(exprs: (pl.Expr | pl.Series<any, string>)[]): LazyDataFrame
Add or overwrite multiple columns in a DataFrame.
Parameters
- exprs: (pl.Expr | pl.Series<any, string>)[]
  List of Expressions that evaluate to columns.
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:469
withColumns(...exprs: (pl.Expr | pl.Series<any, string>)[]): LazyDataFrame
Parameters
- ...exprs: (pl.Expr | pl.Series<any, string>)[]
Returns LazyDataFrame
- Defined in polars/lazy/dataframe.ts:470

withRowCount

withRowCount(): LazyDataFrame
Add a column at index 0 that counts the rows.

Returns LazyDataFrame
See
DataFrame.withRowCount
- Defined in polars/lazy/dataframe.ts:476

Interface LazyDataFrame

Hierarchy

Index

Properties

Accessors

Methods

Properties

[toStringTag]

Accessors

columns

Returns string[]

Methods

[inspect]

Returns string

cache

Returns LazyDataFrame

clone

Returns LazyDataFrame

collect

Parameters

OptionalcommSubexprElim?: boolean

OptionalcommSubplanElim?: boolean

OptionalnoOptimization?: boolean

OptionalpredicatePushdown?: boolean

OptionalprojectionPushdown?: boolean

OptionalsimplifyExpression?: boolean

OptionalslicePushdown?: boolean

Optionalstreaming?: boolean

OptionaltypeCoercion?: boolean

Returns Promise<pl.DataFrame<any>>

collectSync

Parameters

Returns pl.DataFrame

describeOptimizedPlan

Parameters

Returns string

describePlan

Returns string

drop

Parameters

Returns LazyDataFrame

Parameters

Returns LazyDataFrame

Parameters

Returns LazyDataFrame

dropNulls

Parameters

Returns LazyDataFrame

Parameters

Returns LazyDataFrame

Parameters

Returns LazyDataFrame

explode

Parameters

Returns LazyDataFrame

Parameters

Returns LazyDataFrame

Parameters

Returns LazyDataFrame

fetch

Parameters

OptionalcommSubexprElim?: boolean

OptionalcommSubplanElim?: boolean

OptionalnoOptimization?: boolean

OptionalpredicatePushdown?: boolean

OptionalprojectionPushdown?: boolean

OptionalsimplifyExpression?: boolean

OptionalslicePushdown?: boolean

Optionalstreaming?: boolean

OptionaltypeCoercion?: boolean

Returns Promise<pl.DataFrame<any>>

Parameters

Returns Promise<pl.DataFrame<any>>

fetchSync

Parameters

Returns pl.DataFrame

Parameters

Returns pl.DataFrame

fillNull

Parameters

`Optional`commSubexprElim?: boolean

`Optional`commSubplanElim?: boolean

`Optional`noOptimization?: boolean

`Optional`predicatePushdown?: boolean

`Optional`projectionPushdown?: boolean

`Optional`simplifyExpression?: boolean

`Optional`slicePushdown?: boolean

`Optional`streaming?: boolean

`Optional`typeCoercion?: boolean

`Optional`commSubexprElim?: boolean

`Optional`commSubplanElim?: boolean

`Optional`noOptimization?: boolean

`Optional`predicatePushdown?: boolean

`Optional`projectionPushdown?: boolean

`Optional`simplifyExpression?: boolean

`Optional`slicePushdown?: boolean

`Optional`streaming?: boolean

`Optional`typeCoercion?: boolean

`Optional`by?: ColumnsOrExpr

`Optional`closed?: "none" | "left" | "right" | "both"

`Optional`includeBoundaries?: boolean

`Optional`label?: string

`Optional`offset?: string

`Optional`period?: string

`Optional`startBy?: StartBy

`Optional`by?: ColumnsOrExpr

`Optional`closed?: "none" | "left" | "right" | "both"

`Optional`offset?: string

`Optional`allowParallel?: boolean

`Optional`forceParallel?: boolean

`Optional`how?: JoinType

`Optional`leftOn?: string | string[]

`Optional`on?: string | string[]

`Optional`rightOn?: string | string[]

`Optional`suffix?: string

`Optional`allowParallel?: boolean

`Optional`by?: string | string[]

`Optional`byLeft?: string | string[]

`Optional`byRight?: string | string[]

`Optional`forceParallel?: boolean

`Optional`leftOn?: string

`Optional`on?: string

`Optional`rightOn?: string

`Optional`strategy?: "backward" | "forward" | "nearest"

`Optional`suffix?: string

`Optional`tolerance?: string | number