由于当前比较紧急的是爬数据的需求,所以找了一个爬虫程序试试水。
根据指引运行第一个爬虫程序,得到指定网页的文章标题,并写入空白txt,如下:
在文件夹下生成title1.txt文件。
这里有个问题,直接在PCcharm打开txt文件,中文字符是乱码,但是在文件管理器中打开能正常显示,猜测是编码问题,类如utf-8之类,后续再研究。
关于PCcharm界面,英文实在有点吃力,建议初期可以用中文,方便理解。可以通过中文插件实现。具体是
setting——plugin——搜索Chinese——选择自己喜欢的中文插件。其余插件也是一样。
2023/5/14补充:如果插件管理中MarketPlace中无内容,可能是HTTP Proxy没有进行相关配置的问题,解决方式如下:首先打开设置->外观&行为->系统设置->HTTP Proxy,界面如下图
自动检测代理——配置http://plugins.jetbrains.com——清除密码——检查连接,弹框提示successful就成功了
以此记录我的学习过程,也希望给予后来者帮助。