百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

NodeJs入门,带你获取头条热搜形成好看的标签云

bigegpt 2024-10-08 00:54 34 浏览

在学习NodeJs之前,你可能需要学习JavaScript,最好也了解一下es6。

我们这篇文章是针对今日头条(以下称头条)的热搜榜数据的分析,形成一种标签云,重点是如何获取热搜榜的数据。

此篇文章只是分享学习过程,切勿利用此方法进行违法行为!

先了解下NodeJs

Node.js是一个JavaScript运行时环境(可以解析和执行JavaScript代码),它让javascript可以开发后端程序,Nodejs是基于V8引擎,V8是Google发布的开源JavaScript引擎,本身就是用于Chrome浏览器的js解释部分,但是Ryan Dahl 这哥们,鬼才般的,把这个V8搬到了服务器上,用于做服务器的软件。只要你懂js基础就可以学会Nodejs后端开发。

Nodejs 环境搭建

关于NodeJs环境搭建这里想必也不用多说,网上教程很多,如果你在看这篇文章的同时有具体问题的话可以私信我,这里不做多的说明。

我们直奔主题,我们先分析一下头条的热搜榜:

如何找到头条的热搜榜

1.打开头条的搜索,搜索【热搜】点击查看更多,进入的页面就是头条的热搜榜页面,当然还有其它的方式,毕竟头条的理念就是千人千面,你我看到的东西肯定是不一样的,大部分用户里面搜索都是可以进入热搜榜的。

2.进入热搜榜之后,我们只能看到数据,要对数据和页面进行分析,最好的办法就是将页面分享到电脑端,利用浏览器可以分析整个页面的数据。

3.好了,我这里已经找到了热搜榜的地址,由于地址较长,放到内容页面影响版式,我放到了文章结尾的扩展地址里,需要的点击扩展地址,进入之后选择复制地址。

页面分析

通过浏览器的network功能,我们很方便的就会看到,在这个页面获取热搜词的时候,调用了一个接口,那么我们获取热搜词的时候也可以调用,这里不方便将接口直接放出来,有需要的可以进入热搜榜提取接口地址。

数据提取

我们知道获取数据的接口,那么提取数据也就肯方便了,Nodejs支持npm安装大量的插件有助于开发,我们这里会用到request,等工具

首先我们获取热搜词

安装request 包

npm install --save request

我们通过分析发现获取热词的API是通过get请求的,那么我们用get请求的方式获取

var request = require('request');
request('热搜API地址', function (error, response, body) {
  if (!error && response.statusCode == 200) {
    // do something
  }
})

我们请求后会拿到这样的数据

至此,数据的获取已经完成了,接下来我们要去怎么处理数据呢

数据的处理

我们读到的热词数据总共有60多条,60条数据生成的云图太单调了,那么我这边记录了近3天来的数据,总共是264条数据。我们将这264条数据放到云图中会是怎么样的呢?

我这里选用的是美寄词云在线生成的云图,需要将各个词用空格分割,

那么我这里就需要将数据转换成以上的这种格式。

最终结果请看下图

参考资料

  1. Node.js v12.14.1 文档

更多精彩内容,请关注【科技男】头条号,有任何问题可以私信交流。

相关推荐

pyproject.toml到底是什么东西?(py trim)

最近,在Twitter上有一个Python项目的维护者,他的项目因为构建失败而出现了一些bug(这个特别的项目不提供wheel,只提供sdist)。最终,发现这个bug是由于这个项目使用了一个pypr...

BDP服务平台SDK for Python3发布(bdp数据平台)

下载地址https://github.com/imysm/opends-sdk-python3.git说明最近在开发和bdp平台有关的项目,用到了bdp的python的sdk,但是官方是基于p...

Python-for-Android (p4a):(python-for-android p4a windows)

一、Python-for-Android(p4a)简介Python-for-Android(p4a),一个强大的开发工具,能够将你的Python应用程序打包成可在Android设备上运行...

Qt for Python—Qt Designer 概览

前言本系列第三篇文章(QtforPython学习笔记—应用程序初探)、第四篇文章(QtforPython学习笔记—应用程序再探)中均是使用纯代码方式来开发PySide6GUI应用程序...

Python:判断质数(jmu-python-判断质数)

#Python:判断质数defisPrime(n):foriinrange(2,n):ifn%i==0:return0re...

为什么那么多人讨厌Python(为什么python这么难)

Python那么棒,为什么那么多人讨厌它呢?我整理了一下,主要有这些原因:用缩进替代大括号许多人抱怨Python完全依赖于缩进来创建代码块,代码多一点就很难看到函数在哪里结束,那么你就需要把一个函数拆...

一文了解 Python 中带有 else 的循环语句 for-else/while-else

在本文中,我们将向您介绍如何在python中使用带有else的for/while循环语句。可能许多人对循环和else一起使用感到困惑,因为在if-else选择结构中else正常...

python的numpy向量化语句为什么会比for快?

我们先来看看,python之类语言的for循环,和其它语言相比,额外付出了什么。我们知道,python是解释执行的。举例来说,执行x=1234+5678,对编译型语言,是从内存读入两个shor...

开眼界!Python遍历文件可以这样做

来源:【公众号】Python技术Python对于文件夹或者文件的遍历一般有两种操作方法,一种是至二级利用其封装好的walk方法操作:import osfor root,d...

告别简单format()!Python Formatter类让你的代码更专业

Python中Formatter类是string模块中的一个重要类,它实现了Python字符串格式化的底层机制,允许开发者创建自定义的格式化行为。通过深入理解Formatter类的工作原理和使用方法,...

python学习——038如何将for循环改写成列表推导式

在Python里,列表推导式是一种能够简洁生成列表的表达式,可用于替换普通的for循环。下面是列表推导式的基本语法和常见应用场景。基本语法result=[]foriteminite...

详谈for循环和while循环的区别(for循环语句与while循环语句有什么区别)

初九,潜龙勿用在刚开始使用python循环语句时,经常会遇到for循环和while循环的混用,不清楚该如何选择;今天就对这2个循环语句做深入的分析,让大家更好地了解这2个循环语句以方便后续学习的加深。...

Python编程基础:循环结构for和while

Python中的循环结构包括两个,一是遍历循环(for循环),一是条件循环(while循环)。遍历循环遍历循环(for循环)会挨个访问序列或可迭代对象的元素,并执行里面的代码块。foriinra...

学习编程第154天 python编程 for循环输出菱形图

今天学习的是刘金玉老师零基础Python教程第38期,主要内容是python编程for循环输出菱形※。(一)利用for循环输出菱形形状的*号图形1.思路:将菱形分解为上下两个部分三角形图案,分别利用...

python 10个堪称完美的for循环实践

在Python中,for循环的高效使用能显著提升代码性能和可读性。以下是10个堪称完美的for循环实践,涵盖数据处理、算法优化和Pythonic编程风格:1.遍历列表同时获取索引(enumerate...