原来用Python自己写的,试了下发现时间太久跑不起来了。那就直接用外部工具吧。目前测试下来,感觉这样的方式比较好:
- 用阿明工具箱下载评论数据。很快,比自己python爬快多了,5000条大概十几秒就搞定了。
- 用微词云(https://www.weiciyun.com/)来进行分词,工具会对单词进行自动分类,非常好用,还是免费的。
- 用Google Sheets的Query语句来筛选指定关键词的评论,可以非常方便的看到对应的评论详情,效率大增。
原来用Python自己写的,试了下发现时间太久跑不起来了。那就直接用外部工具吧。目前测试下来,感觉这样的方式比较好:
之前一直用Google Sheets处理店铺的数据。但随着后面流量和销量起来以后,每天的数据量都很大,一两个月的数据就超越了Google Sheets每个文件500万表格的限制。了解到Google的Bigquery可以作为Google Sheets的后端,于是就打算往这个方向。
今天第一天上手,简单记录一下中间遇到的几个坑,或者说是学习到的点。
后面有什么遇到的问题,再随时往上补。