百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章
Python之jieba分词使用技巧

jieba库支持三种分词模式:精确模式、全模式和搜索引擎模式下面是三种模式的特点:精确模式:试图将语句最精确的切分,不存在冗余数据,适合做文本分析全模式:将语句中所有可能是词的词语都切分出来,速度很快...

浅学python | 列表切片

分享兴趣,传播快乐,增长见闻,留下美好!亲爱的您,这里是LearningYard学苑。欢迎大家继续访问学苑内容,今天小编为大家带来有关Python的知识。Shareinterest,spread...

python文本分析与挖掘(三)-词频统计

实现功能:前一篇文章我介绍了文本分析与挖掘的第一步和第二步(具体可参加前两篇文章),即构建语料库和中文分词,这篇文章将在此基础上进行词频统计。实现代码:1importos2fromwarnings...

数据分析中,用Python轻松挖掘相似评论(文本)

大家好。我们现在做数据分析的时候,不可避免地会与文本数据打交道,今天跟大家分享在数据分析中,如何挖掘出相似的文本。本文从提出问题,到解决问题,再到算法原理三个方面来介绍。1.提出问题假设在一个电商A...

Python 图片尺寸缩放的4种方式

最近由于网站对图片尺寸的需要,用python写了个小脚本,方便进行图片尺寸的一些调整,特记录如下:#coding=utf-8importImageimportshutilimportosc...

【Python机器学习系列】一文教你绘制校准曲线(案例+源码)

这是我的第240篇原创文章。一、引言校准曲线绘制的基本步骤如下:1.首先根据预测模型输出目标事件的预测概率;2.根据预测概率从小到大进行排序,并按照等分位点划分成N组;3.分别计算各组的实际事件...

python爬取B站网页弹幕内容,并将爬取内容以五角星的形式显示出来

思路:向哔哩哔哩网站发送请求请求成功后,解析爬取的弹幕内容保存到一个文件中读取文件并分析弹幕内容中词组或文字出现的频率将这些词组或文字组成五角星图形组成五角星图形后,以图片的形式输出使用到的类库,如果...

用Python创建功能模块——截取字符串模块

用Python创建模块本篇文章小编给大家分享在Python如何创建属于自己的模块,实现更多的功能!一、模块模块是什么?简单来说,当程序的功能很多、代码量很大时,我们可以编写一个实现一定功能的pyth...

真香,Python爬取B站弹幕原来如此简单,源码已附在文末

B站的弹幕区一直是人才圣地。今天我就用python来手把手教大家爬取B站排行榜热门视频,Python爬取视频也可以如此简单。网站分析在B站中,只要视频中有弹幕,就会有一个cid参数。cid用...

零基础学习Python语言的常用功能网络爬虫:影片短评

在上一篇文章里介绍了利用find_all的方法来对网络上电影的排名,今天我们介绍一个利用select函数的方法。方法二:利用select函数#x1=soup.find_all("li"...