因为Linux下没有工具能够下载百度文库的文章,所以就分析了下文库过程,知道原来文库内容只是多个SWF的合并。 使用Chromium/Opera的Inspect Element工具,分析表单提交过程如下:
从上边的表单流程知道首先页面请求了reader.swf,然后这个reader.swf继续请求下载真正的文档内容。那么我们需要分析 这些数据的结构,和reader.swf如何分析这些数据。让我们先把reader.swf反汇编看看到底做了什么,其中showmycode能够被使用。