商务服务
JavaScript 逆向技巧总结
2024-11-17 23:54

本节属于知识总结,只是对思路的梳理,不对具体内容进行展开

Javas<em></em>cript 逆向技巧总结

JS 逆向可以分为三大部分: 寻找入口, 调试分析, 模拟执行

寻找入口: 这是非常关键的一步,逆向在大部分情况下就是找一些加密参数到底是怎么来的,比如请求中的 token ,sign 等参数到底在哪里构造的, 这个关键逻辑可能写在某个关键的方法里面或者隐藏在某个关键的变量里面。一个网站加载了很多 JS 文件,那么怎么从这么多 JS 代码里面找到关键的位置,那就是一个关键的问题,这就是寻找入口

调试分析: 找到入口后,比如我们可以定位到某个参数可能是在某个方法里面执行了的,那么里面的逻辑究竟是怎样的,里面调用了多少加密算法,经过了多少变量赋值和转换等,这些需要我们先把整体思路整理清楚,以便于我们后面进行模拟调用或者逻辑改写。在这个过程中,我们主要借助于浏览器的调试工具进行断点调试分析,或者借助一些反混淆工具进行代码的反混淆

模拟执行: 经过调试分析之后,我们差不多已经搞清楚整个逻辑了,但我们最终目的还是写爬虫,怎么爬取到数据才是根本,因此这里就需要对整个加密过程进行逻辑复写或者模拟执行,以把整个加密流程模拟出来,比如输入一些已知变量,调用之后我们就可以拿到一些 token 内容,再用这个 token 进行数据爬取即可

本节将对以上内容进行梳理

其中包括 查看请求, 搜索参数, 分析发起调用, 断点, Hook 等

一般来说,我们都是先分析想要的数据到底从哪里来的。 比如说对示例网站

https://spa6.scrape.center

Javas<em></em>cript 逆向技巧总结

我们可以看到首页有一条条数据,这些数据肯定是某个请求返回的,那它究竟是从哪个请求里面来的呢? 我们可以先尝试搜索一下

打开浏览器开发者工具,打开 Network 面板,然后点击搜索按钮, 比如这里我们搜索 “霸王别姬”

注意: 要把中间的内容刷新出来才搜索,不然什么都搜不到

Javas<em></em>cript 逆向技巧总结

我们可以看到对应的搜索结果,点击搜索到的结果,我们可以定位到响应结果的位置

Javas<em></em>cript 逆向技巧总结

这样我们看到了是哪里发起的请求

Javas<em></em>cript 逆向技巧总结

我们还可以看到请求的参数,比如 token 

一般来说,我们可以通过这种方式寻找最初的突破口。如果请求中带有加密参数,就顺着继续找这个参数究竟在哪里生成的。如果没有加密参数,我们就可以直接爬取

前面我们找到了最初的突破口,同时也找到了加密参数 token ,这里我们看看 token 怎么构造出来的

一种简单的方法就是全局搜索。一般来说,参数名大多数情况下就是一个普通的字符串,比如这里叫做 token ,那么这个字符串肯定隐藏在某个 JS 文件中,我们可以尝试进行搜索,也可以加 冒号,空格,引号等来配合搜索。因为一般来说这个参数会配合一些符号一起出现,比如我们可以搜 token   token:   token :  "token"  等,我们可以直接调用浏览器调试面板的搜索功能

Javas<em></em>cript 逆向技巧总结

这是一个资源搜索入口,比如可以搜索下载下来的 JS 文件的内容这里我们输入 token 来进行搜索

Javas<em></em>cript 逆向技巧总结

如果内容不显示,是可以上拉的,这里搜索到的结果,我们可以点进去看看里面是不是我们要的内容

上述搜索是其中一种查找入口的方式,这是从源码级别上直接查找。我们也可以通过其他思路来查找入口,比如可以查看发起调用的流程。

可以直接从 Network 请求里面的 Initiator 查看当前请求构造的相关逻辑

Javas<em></em>cript 逆向技巧总结

看不到内容,当我们鼠标悬停在 Initiator 那一栏的时候会出现对应的调用

Javas<em></em>cript 逆向技巧总结

我们可以看到每一层的调用,我们可以依次点进去查看,比如这里的第八层调用了一个 onFetchData 方法, 点击右侧代码位置,我们就可以找到一些相关的逻辑

Javas<em></em>cript 逆向技巧总结

另外我们还可以通过断点进行入口查找,比如 XHR 断点, DOM 断点,事件断点等。我们可以在开发者工具中的 Sources 面板里面添加设置,比如这里我们就添加了 XHT 断点和全局 Load 事件断点

Javas<em></em>cript 逆向技巧总结

这样网页就可以在整个页面加载完成之后,发起 Ajax 请求的时候停下来,进入断点调试模式。

Hook 也是一个非常常用的查找入口的功能。有时候,一些代码搜索或者断点并能很有效的找到对应的入口位置,这时候就可以使用 Hook 了

比如说我们可以对一些常用的加密和编码算法,常用的转换操作都进行一些 Hook , 比如说 base64编码, cookie 的赋值, JSON 的序列化等

比较方便的 Hook 方式就是通过 TamporMonkey 这个插件实现,使用它我们不仅可以方便的自定义脚本执行时间点,也可以引入一些额外的脚本辅助 Hook 进行代码编写,具体实现可以查阅相关资料

以上便是一些常见的分析入口的方法,当然还有很多其他方法,比如使用 Pyppeteer, PlayWright 里面内置的 API 实现那一些数据拦截和过滤功能, 也可以使用一些抓包软件对一些请求进行拦截和分析,还可以使用一些第三方工具或浏览器来辅助分析

找到对应的入口后我们就要开始调试分析了。在这个步骤中我们通常需要进行一些格式化,断点调试,反混淆等操作来辅助整个流程的分析

格式化这个流程非常重要,它可以大大增加代码的可读性,一般来说很多 JS 代码都是经过打包和压缩的。多数情况下我们可以使用 Sources 面板下 JS 窗口左下角的格式化按钮对代码进行格式化

Javas<em></em>cript 逆向技巧总结

另外还有一些网站的 HTML 和 JS 是混在一起的,比如 : https://spa8.scrape.center/

Javas<em></em>cript 逆向技巧总结

如果代码被压缩成一行,无法利用前面的方法格式化,可以把代码复制下来,然后用一些格式化工具进行格式化,例如: https://beautifier.io/

Javas<em></em>cript 逆向技巧总结

我们还可以选择一些格式化的选项,比如缩进, 换行等

代码格式化之后,我们就可以正式进入调试流程了,基本操作就是给想要调试的代码添加断点,同时在对应的面板里观察对应变量的值

Javas<em></em>cript 逆向技巧总结

在某些情况下,我们还有可能遇到一些混淆方式,比如控制流扁平化,数组移位等。对于一些特殊的混淆,我们可以使用 AST 技术来对代码进行还原。

比如案例:  https://antispider10.scrape.center  就使用控制流扁平化方式对代码进行混淆

不要管页面怎么显示,只看代码

Javas<em></em>cript 逆向技巧总结

可以看到,这里有一个 while 循环,循环内通过一些判断条件来执行一些逻辑,有的逻辑放在了 if 区块, 有的逻辑放在了 else 区块,还有的逻辑放在了 catch 区块, 这就导致我们无法一下子了解这几个区块的真正执行顺序

对于此类混淆,我们可以使用 AST 进行还原,方便更好的阅读,关于 AST 可以查阅相关资料

经过一系列的调试,现在我们已经可以理清其中的逻辑了, 接下来就是一些调用执行的过程了。

由于 Python 简单易用,同时也能够模拟调用执行 JS ,如果整体逻辑不复杂的话,我们可以尝试使用 Python 来把整个加密流程完整的实现一遍。如果整体流程相对复杂,我们可以尝试使用 Python 来模拟调用 JS 来执行

由于整个逻辑是 JS 实现的,使用 Python 来执行 JS难免会有一些不太方便的地方。而 Node.js 天生就有对 JS 的支持。为了更通用的实现 JS 的模拟调用, 我们可以用 express 来模拟调用 JS, 同时将其暴露成一个 API , 从而可以实现跨语言调用

由于整个逻辑是运行在浏览器里面的,我们当然也可以将浏览器当做整个执行环境。比如使用 Selenium ,PlayWright 等来尝试执行一些 JS 代码,得到一些返回结果

    以上就是本篇文章【JavaScript 逆向技巧总结】的全部内容了,欢迎阅览 ! 文章地址:http://sicmodule.glev.cn/news/10022.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 歌乐夫资讯移动站 http://sicmodule.glev.cn/mobile/ , 查看更多   
最新新闻
2025年是乙巳年,老人说:明年“青蛇遇六卯,三人要发富”,指啥
乙巳年为啥被称之为“青蛇年”?古人计算时间,喜欢用天干地支,而干支历当中,六十甲子一个循环,甲辰年之后,就是乙巳年,而十
2024年想赚钱,这5个行业别错过,就算是新人,也能闷声发大财!
随着社会的不断发展和变化,行业的兴衰更迭也日益显著。对于想要在2024年赚钱的人来说,选择一个有潜力的行业至关重要。特别是这
为什么李子柒抖音涨粉最快最多?
数据显示,李子柒回归首条视频2小时获赞破百万、当日播放量破亿,点赞量已接近1000万,当日抖音涨粉量突破500万,目前其抖音粉丝
下一个李子柒,为何还是李子柒?
停更三年多,李子柒归来仍是“王者”,不仅在国内社交媒体轰动一时,也受到海外粉丝的热烈追捧。复更首支“漆器”视频发布10分钟
李子柒与微念事件:是商业大冒险 还是田园生活的逆袭?
本文系深潜atom第418篇原创作品羽衣翩跹的李子柒(本名:李佳佳)停更5个月了。公众最近关注到她,除了接受采访时谈及共同富裕、
李子柒归来仍是顶流
  在长达1200多天的停更之后,传统文化领域短视频创作者李子柒于11月12日正式回归,迅速引爆全网,一夜涨粉近400万,粉丝总数
下班搞副业成热潮:有人月入过万
最近,“下班后的年轻人开始搞第二事业了”的话题频登社交平台热搜。摆摊卖东西、喂宠物、做自媒体、去店铺兼职……在上班与下班
李子柒现状及收入揭秘
近日,关于李子柒的收入被曝光,引起了网络上的热议。这位优秀的短视频创作者在过去的一年多时间里,虽然暂停了更新,但其在海外
李子柒复出热搜!探寻她的传奇人生与背后的故事
李子柒,原名李佳佳,1990年出生于四川省绵阳市,是一位以短视频创作而闻名的美食博主。她的回归,无疑是当下网络热搜的一大焦点
李子柒事件是怎么回事 发生了什么
近两个月来,关于李子柒的事件显得扑朔迷离,这个曾经被誉为生活在世外桃源的仙女终究也难逃世俗纠纷,被卷入了一场舆论与资本的