在这个大数据时代，我们眼睛所看到的百分之九十的数据都是通过页面呈现出现的，不论是PC端、网页端还是移动端，数据渲染还是基于html/h5+javascript进行的，而大多数的数据都是通过请求后台接口动态渲染的。而想成功的请求成功互联网上的开放/公开接口，必须知道它的URL、Headers、Params、Body等数据是如何生成的。但是在此之前我们需要了解浏览器开发者工具的功能，入门JS逆向。

1、浏览器面板认识

浏览器F12开发者工具面板

Elements（元素）

HTML源代码页面，可以进行动态查询、修改、删除，影响页面显示

Network（网络）

最常使用的功能，俗称抓包界面。可以捕获当前页面的所有资源请求，包括URL、协议、端口、请求和响应等

保留日志：勾选每次刷新不会清除之前的请求
停用缓存：勾选后不会从缓存里面拉数据，方便后续JS动态调试

Sources（源代码）

存放网页源代码的地方，这里可以看到访问站点所有依赖的域名资源，包括html、css、js等

page ：所有资源文件
filesystem：关联本地文件
overrides：可以做文件替换，比如替换JS
代码段：可以编写脚本，影响页面,代码记录
断点介绍

断点

1. 跳过子函数（次态函数）执行（只在主函数内一步一步执行，不进入子函数内部）；
2. 进入子函数（次态函数）执行（在主函数内部一步一步执行，如果遇到子函数，会跳转到子函数内部一步一步执行）；
3. 跳出当前函数，回到调用位置；
4. 单步执行，会进入到函数内部更加的细致；
最后一个图标：屏蔽断点

Application（应用）

相当于一个浏览器本地数据库，可查看本地会话存储、Cookies等信息

2、JS逆向的目标

如果想要逆向网页的某个API，需要以下关键信息：

请求信息

头部签名
请求体签名
cookie反爬
响应数据反爬
查询参数签名

3、断点介绍

断点的主要作用是对数据进行监听，就跟平时开发代码Debug调试一样，跟值进行分析

网站运行时间轴：

数据流程

DOM事件断点

执行的比较靠前距离加密函数比较远

XHR断点

执行比较靠后距离加密函数相对较近，可以根据栈快速定位

注意：非XHR发送的就断不住

4、方法栈

栈是一种先进后出的特殊线性表结构

调用栈是解析器的一种机制，可以在脚本调用多个函数时，跟踪每个函数在完成执行时应该返回控制的点

当脚本要调用一个函数时，解析器把该函数添加到栈中并且执行这个函数。
任何被这个函数调用的函数会进一步添加到调用栈中，并且运行到它们被上个程序调用的位置。
当函数运行结束后，解释器将它从堆栈中取出，并在主代码列表中继续执行代码。

栈

5、debug原理

无限debbugger不会真正得死循环，而是有规律得执行逻辑，一般用定时器

Function("debugger;").call()

样例




    
    Title






<script>
    var ss = document.getElementById('IMS')
    function test() {
        debugger;
    }
    setInterval(test,100);

    ss.innerHTML = "HELLO WORLD";

</script>

浏览器过debugger

当定义器运行到这个debugger这个代码的时候，可以点击“一律不再此处暂停”

Debugger断点处理

编辑断点（条件断点）

写个1===0的先验条件，永远为假，就永远不会进入这个断点了。

方法置空

无限debugger产生的原因是代码里 test 这个函数造成的,所以我们可以重写这个函数,使无限debugger失效.在控制台中输入function test(){}即可

注：一定要在debugger进入之前

setInterval = function test(){}

通用过OB混淆debugger

Function.prototype.__constructor_back = Function.prototype.constructor;
Function.prototype.constructor = function() {
    if(arguments && typeof arguments[0]==='string'){
        if("debugger" === arguments[0]){
            return
        }
    }
   return Function.prototype.__constructor_back.apply(this,arguments);
}

6、hook技术

Hook 是一种钩子技术，在系统没有调用函数之前，钩子程序就先得到控制权，这时钩子函数既可以加工处理（改变）该函数的执行行为，也可以强制结束消息的传递。简单来说，修改原有的 JS 代码就是 Hook。

Hook 技术之所以能够实现有两个条件：

客户端拥有 JS 的最高解释权，可以决定在任何时候注入 JS，而服务器无法阻止或干预。服务端只能通过检测和混淆的手段，另 Hook 难度加大，但是无法直接阻止。
除了上面的必要条件之外，还有一个条件。就是 JS 是一种弱类型语言，同一个变量可以多次定义、根据需要进行不同的赋值，而这种情况如果在其他强类型语言中则可能会报错，导致代码无法执行。js 的这种特性，为我们 Hook 代码提供了便利。

注意：JS 变量是有作用域的，只有当被 hook 函数和 debugger 断点在同一个作用域的时候，才能 hook 成功。

Hook步骤：

寻找hook的点
编写hook逻辑
调试

注：最常用的是hook cookie

HOOK cookie操作

WebAPI地址：
https://developer.mozilla.org/zh-CN/docs/Web/API

Object.defineProperty为对象的属性赋值，替换对象属性

基本语法：Object.defineProperty(obj, prop, descriptor)，它的作用就是直接在一个对象上定义一个新属性，或者修改一个对象的现有属性，接收的三个参数含义如下：

obj：需要定义属性的当前对象；
prop：当前需要定义的属性名；

Object.defineProperty(user,"uuid",{
 get:function(){
      console.log("xxx来获取值了！！");
      return count;
 },

 set:function(newVal){
      console.log("xxx来设置值了！！");
      count=newVal+1;
 }
})

cookie 示例

cookie 钩子用于定位 cookie 中关键参数生成位置，以下代码演示了当 cookie 中匹配到了 v，则插入断点：

(function () {
  var cookieTemp = '';
  Object.defineProperty(document, 'cookie', {
    set: function (val) {
      if (val.indexOf('v') != -1) {
        debugger;
      }
      console.log('Hook捕获到cookie设置->', val);
      cookieTemp = val;
      return val;
    },
    get: function () {
      return cookieTemp;
    },
  });
})();

注：正常hook cookie操作的时候需要清除下cookie

hook 方法

我们知道在 JavaScript 中 JSON.stringify() 方法用于将 JavaScript 对象或值转换为 JSON 字符串，JSON.parse() 方法用于将一个 JSON 字符串转换为 JavaScript 对象，某些站点在向 web 服务器传输用户名密码时，会用到这两个方法

(function() {
        var stringify = JSON.stringify;
        JSON.stringify = function(params) {
            console.log("Hook JSON.stringify ——> ", params);
            debugger;

            return stringify(params);
        }
    })();

首先定义了一个变量 stringify 保留原始 JSON.stringify 方法，然后重写 JSON.stringify 方法，遇到 JSON.stringify 方法就会执行 debugger 语句，会立即断下，最后将接收到的参数返回给原始的 JSON.stringify 方法进行处理，确保数据正常传输

hook XHR请求

(function () {
    var open = window.XMLHttpRequest.prototype.open;
    window.XMLHttpRequest.prototype.open = function (method, url, async) {
        if (url.indexOf("analysis") != 1) {
            debugger;
        }
        return open.apply(this, arguments);
    };
})();

定义了一个变量 open 保留原始 XMLHttpRequest.open 方法，然后重写 XMLHttpRequest.open 方法，判断如果 rnd 字符串值在 URL 里首次出现的位置不为 -1，即 URL 里包含 analysis字符串，则执行 debugger 语句，会立即断下。

7、python执行JS的方式

PyExecJS

模块地址：
https://github.com/doloopwhile/PyExecJS

PyExecJS 是使用最多的一种方式，底层实现方式是：在本地 JS 环境下运行 JS 代码

pip install PyExecJS

读取JS代码

with open(file_name, 'r', encoding='UTF-8') as file:
    result = file.read()

execjs 类的compile()方法编译加载上面的 JS 字符串，返回一个上下文对象

context1 = execjs.compile("JS代码")

调用上下文对象的call() 方法执行 JS 方法

result1 = context1.call("函数", "参数1", "参数2")

注意：由于 PyExecJS 运行在本地 JS 环境下，使用之前会启动 JS 环境，最终导致运行速度会偏慢

eval执行

eval() 函数计算 JavaScript 字符串，并把它作为脚本代码来执行

print(execjs.eval('Date.now()'))

8、浏览器环境补充方法

document = {
    cookie:'uuid_tt_dd=10_29360271920-1658044222535-945484; __gads=ID=5b925b796ab29466-22740a5938d50041:T=1658044224:RT=1658044224:S=ALNI_MYZZ3qnATdjgh4YHRlZaBk3TnwTFw; p_uid=U010000',
    location : {
        href:'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=87135040_oem_dg&wd=eval%20JS%20&fenlei=256&oq=eval&rsv_pq=e1b3f2520003297e&rsv_t=7e58%2ByqRgVEysyNAVRctyGmKUct9An%2B6da7wzdVJDXgo7qaAS1DKyn86mLazGA1IqBPpY359&rqlang=cn&rsv_dl=tb&rsv_enter=1&rsv_btype=t&inputT=860&rsv_sug3=56&rsv_sug1=35&rsv_sug7=100&rsv_sug2=0&rsv_sug4=1037'
    }
}
navigator = {userAgent:'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36'}

window = {
    document : document,
    navigator:navigator
}
console.log(document.location.href);
document.getElementsByTagName = function(){};

结语

用阳光乐观的心态去面对生活和工作，它们一样也会回报给你阳光。

网页数据如何获取，带你走近JS逆向，完全入门级!

1、浏览器面板认识

Elements（元素）

Network（网络）

Sources（源代码）

Application（应用）

2、JS逆向的目标

3、断点介绍

DOM事件断点

XHR断点

4、方法栈

5、debug原理

样例

浏览器过debugger

编辑断点（条件断点）

方法置空

通用过OB混淆debugger

6、hook技术

Hook步骤：

HOOK cookie操作

hook 方法

hook XHR请求

7、python执行JS的方式

PyExecJS

8、浏览器环境补充方法

结语

相关推荐

无缓存不行?例行升级的入门级阿斯加特AN2 SSD装机点评

Ceph运维手册(基于P版本)

Docker 命令大全（docker命令大全记录表）

替代Docker build的Buildah简单介绍

Docker Desktop安装使用指南:零基础教程

Tensorflow分类loss函数总结 tensorflow绘制loss曲线

R语言学习笔记(七) -离散型数据的模型预测2

服务器硬件RAID性能横评(2)（服务器常用raid技术）

Python教程:第9篇字符串基本操作

k8s中三种POD调度策略介绍 k8s pod间调用

网页数据如何获取，带你走近JS逆向，完全入门级!

1、浏览器面板认识

Elements（元素）

Network（网络）

Sources（源代码）

Application（应用）

2、JS逆向的目标

3、断点介绍

DOM事件断点

XHR断点

4、方法栈

5、debug原理

样例

浏览器过debugger

编辑断点（条件断点）

方法置空

通用过OB混淆debugger

6、hook技术

Hook步骤：

HOOK cookie操作

hook 方法

hook XHR请求

7、python执行JS的方式

PyExecJS

8、浏览器环境补充方法

结语

相关推荐

无缓存不行?例行升级的入门级阿斯加特AN2 SSD装机点评

Ceph运维手册(基于P版本)

Docker 命令大全（docker命令大全记录表）

替代Docker build的Buildah简单介绍

Docker Desktop安装使用指南:零基础教程

Tensorflow分类loss函数总结 tensorflow绘制loss曲线

R语言学习笔记(七) -离散型数据的模型预测2

服务器硬件RAID性能横评(2)（服务器常用raid技术）

Python教程:第9篇 字符串基本操作

k8s中三种POD调度策略介绍 k8s pod间调用

Python教程:第9篇字符串基本操作