我正在清理一个谷歌Playstore评论数据集。 它包含了超过10k个应用程序的详细信息,包括应用程序名称,价格,评论,安装等栏目。 有一行数据被替换,价格列包含值“Everyone”而不是价格值。
我试着用
df_path['Price'] = df_path[df_path.Price != 'Everyone']
这样做之后,我注意到当我检查时,行被删除了
df_path.info()
在此之后,当我使用
df_path.Price.value_counts()
发生了严重的错误。 Price列将被列名的值替换。 这并不是我试图删除该行的唯一方法。 我还尝试使用df.drop()命令,也发生了同样的事情。 最糟糕的是,在发生这种情况后,它将数据类型显示为int64。 参考下面的图像链接。
我做错了什么? Price col将被应用程序名称替换,类型为int64
能不能请你包含更多你的代码来帮助我回答你的问题?
能否请您展示一个例子,说明您所说的“有一行数据被移位,价格列包含值'Everythe',而不是一个价格值”是什么意思。