网页代码过滤 轻松获取专辑目录

boyanx3周前技术教程11

通过过滤网页代码,可以将网页上显示不全的长文件名列表完整地提取出来。

我有一个含有75个视频文件的《中医诊断学》课件,文件名是以01.RMVB、02.RMVB……75.RMVB这种格式命名的。我希望能找到代表各集文件的标题替换掉以数字命名的视频文件名,这样便于在学习时按文件名点播。我在网上搜索和发帖求助,都没能找到该视频序列的现成文本名列表,但在一个视频网站上发现有该视频专辑的播放页面,却因播放页面上显示的文件名不全而无法以直接复制的办法取得完整的文件名序列(图1)。如果用点击每个链接,查看链接属性,复制完整链接名的办法,倒是可以获得完整的文件名称,但那样一个接一个地操作效率太低了。有没有效率更高的办法呢?

借助网页代码过滤是个解决问题的办法。既然用右键单击链接可以看到完整的视频文件名称,那说明在网页代码中肯定存在完全的视频文件名的记录。获得了网页代码,这些完整文件名也就在其中了。

但是,在网页代码中,完整的文件名是混杂在非常复杂的网页代码中的(图2),如何快速从这密密麻麻的网页中提取出我们所需要的完整视频文件名?这倒成了一个大问题。

最后,我在网页代码的基础上,利用文本编辑器软件的过滤替换技术,在很短的时间内过滤出自己需要的完整文件名序列。具体方法如下。

获取网页代码

右键单击网页,选择快捷菜单命令“查看源文件”,系统会自动用记事本打开网页的源文件代码。

借用EmEditor处理

由于记事本本身对源代码的过滤编辑作用有限,所以我们可以借助于功能强大的文字编辑软件EmEditor来解决问题。

打开EmEditor编辑软件,将以上由记事本获得的网页源码全部复制过来。

过滤网页源代码

经过对源代码的简单分析得知,在每个视频文件名的前面都有一个固定的字符串

用快捷键Ctrl+H启动替换窗口,在“查找”框中输入

最后,再用类似的替换方法成批将其他无关代码段或文字统统替换为空(“替换为”框中不填任何内容),再点一下EmEditor插件工具栏上的一次性删除空白行和重复行命令钮,一次性成批删除多余的空白行和重复行。剩下就是我们要的完全版文件目录列表了。

相关文章

今日推荐——100多个知名网站克隆版的开源代码Clone-Wars

Clone-Wars里面克隆了Airbnb、亚马逊、Instagram、Netflix、Tiktok、Spotify、Trello、Whatsapp、Youtube等100多个知名网站的源代码,其中还...

腾讯元宝再升级,支持一句话生成代码并直接运行

36氪获悉,3月26日,首发接入 DeepSeek V3-0324最新模型后,腾讯元宝再次发布更新,支持实时预览 HTML 代码。用户只需输入一句话,即可生成网页代码并直接看到可运行的页面,实现“所写...

代码小白的网页制作神器

2014-07-23 10:36:28 作者:话说网站就是项目的门面,如何为自己的创业项目做出一个高级又炫酷的网站,能够完整展示出产品功能,在吸引用户的同时也引来投资者的青睐,就成了创业者的一个需求。...

ToolJet低代码神器,网站分分钟上线

“ 国外著名研究机构 Forrester自 2014 年 正式提出「低代码」概念以来,从此在技术领域受到了广泛的关注。现在低代码开发平台已经是很多程序员日常标配效率工具了。”ToolJet 是一套开源...

给大家推荐些好的c语言代码的网站

C语言,那就来推荐几个吧,部分含有C++:1、The Linux Kernel Archives(kernel.org)Linux内核源码,仅限于C,但内核庞大,不太适合新手;2、redis(redi...

四个无代码开发网站推荐,让你轻松开发软件

众所周知,学习程序开发需要大量的时间和经济成本,在这个生活节奏过快的时代,无代码开发网站应运而生。而本文将推荐四个小白也能用的无代码开发网站。一.bubble这是一款十分强大的开发网站,你能想到的软...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。