Beautiful Soup, use find()/find_all() attrs parameter to select HTML tag
Note: This article applies to Python 3 environment. Background Recently, I’m working on a web-scrapying…
Read MoreNote: This article applies to Python 3 environment. Background Recently, I’m working on a web-scrapying…
Read More之前写过从 Teahour.FM 下载 podcast 的博客,最近有空听了其中一部分,觉得质量还不错。 另外,近期又发现了一个新的 podcast,叫「IT 公论」,主题是科技方面的。看了这个 podcast 的介绍页面,感觉应该不错,于是便打算下载下来。 由于上次写的代码里,下载部分的代码是完全可以复用的,所以整个过程还是相当顺利的。这次处理的重点在下载链接(.mp3 文件)的获取上,因为「IT 公论」的音频下载链接并不像 Teahour.FM 那么有规律,因此还需要用正则表达式来获取。…
Read MoreTeahour.FM 是一个 podcast 节目,主题是 web 开发和程序员成长。在每一期节目里,主持人都会邀请一位程序员来聊一些相关的话题。到目前为止(2014.02.23),已经出了 44 期。在听了前面两期后,觉得这个 podcast 还不错,值得一听。于是就打算写程序把它所有的 podcast 都下载到本地,有时间慢慢听。 代码已经写好,放在 GitHUb 上,项目名称叫…
Read More