与 AWS 交互
要读取或写入AWS存储桶,需要额外的依赖项:
$ pip install s3fs
在接下来的几个片段中,我们将演示如何与Parquet
文件交互位于AWS桶上。
读入
使用如下加载一个.parquet
:
import polars as pl
import pyarrow.parquet as pq
import s3fs
fs = s3fs.S3FileSystem()
bucket = "<YOUR_BUCKET>"
path = "<YOUR_PATH>"
dataset = pq.ParquetDataset(f"s3://{bucket}/{path}", filesystem=fs)
df = pl.from_arrow(dataset.read())