我一直在为pandas DataFrame寻找健壮的类型提示,但似乎找不到任何有用的东西。这个问题几乎没有刮伤表面Pythonic type hints with pandas?
通常,如果我想提示函数的类型,该函数会将DataFrame作为输入参数:
import pandas as pd
def func(arg: pd.DataFrame) -> int:
return 1
我似乎找不到的是如何键入提示混合dtypes 的DataFrame。 DataFrame构造函数仅支持完整DataFrame的类型定义。因此,据我所知,dtype中的更改只能在之后使用pd.DataFrame().astype(dtypes={})
函数进行。
这在这里有效,但是对我来说似乎不是很Python
import datetime
def func(arg: pd.DataFrame(columns=['integer', 'date']).astype(dtype={'integer': int, 'date': datetime.date})) -> int:
return 1
我碰到过这样的包装:https://pypi.org/project/dataenforce/,上面有这样的例子:
def process_data(data: Dataset["id": int, "name": object, "latitude": float, "longitude": float])
pass
这看起来有些许希望,但可悲的是该项目已经过时了。
作为一名数据科学家,构建具有较长ETL流程的机器学习应用程序,我相信类型提示很重要。
您使用什么,有人键入来提示他们的熊猫数据框吗?