当前位置：首页 > news >正文

NCDC气象数据的提取与处理（二）：python批量转换isd-lite数据为xlsx

news 来源：原创 2024/5/5 9:14:51

1.完整代码（部分代码参考https://zhuanlan.zhihu.com/p/556150264）

2.工作过程

2.1输入

2.2过程

3.实际效果

本例使用的相关数据及代码可见

链接：https://pan.baidu.com/s/1EYE0U7RrHSGGk3vptZyNVg
提取码：6666

书接上回，在 NCDC气象数据的提取与处理（一）中，

我们得到了研究区内，且观测时间满足一定要求的站点列表，形式如下：

接下来，我们要根据这个站点列表，从全国的站点数据中筛选指定站点，并将isd-lite格式的数据转化为其他形式（本教程以转化为 .xlsx 为例）

闲言少叙，先放代码，再将工作过程：

1.完整代码（部分代码参考https://zhuanlan.zhihu.com/p/556150264）

import os
import pandas as pd
import numpy as np

"""
工作原理：
输入/指定：工作路径，指定年份（时间范围），输入站点列表
过程：指定工作路径下的文件夹全部以“china_isd_lite_”+“年份”命名，
    根据输入的时间范围，创建对应年份的文件夹列表，
    根据输入的站点列表，创建文件名称列表，
    在每个文件夹列表元素下，顺序读取文件名称列表对应文件，并完成数据写入
"""
def trans_isd2excel(station_list,work_dir= r"D:\A_NCDC_test",period= [1980,1981]):  # 工作路径，指定年份（时间范围），站点列表
    datadir_list = []
    for i in os.listdir(work_dir):
        if os.path.splitext(i)[-1]=="" and period[0]<=int(os.path.split(i)[-1][-4:])<=period[1]:  # 判断是否是文件夹，并指定时间范围
            datadir_list.append(work_dir + os.sep + i)             # 年份文件夹 路径，如：'D:\\A_NCDC_test\\china_isd_lite_1980'
    erro_list = []
    for datadir in datadir_list:
        dataname_list = []
        for item in station_list:                                  # 文件名称形式："D:\\A_NCDC_test\\china_isd_lite_1980\\450070-99999-1980"
            dataname_list.append(datadir + os.sep + item + "-99999-" +os.path.split(datadir)[-1][-4:] ) 
        for name in dataname_list:
            try:
                data = pd.read_table(name,header=None)
                '''
                原始数据中以空格分隔的12列数据，分别为：
                年、月、日、小时、温度、露点温度、气压、风向、风速、云量、1小时降雨量和6小时降雨量。
                '''
                # 构建空列表用于存放提取出来的各列数据
                data_list = []
                for line in data.values:
                    line_temp = [int(x) for x in line[0].split(' ') if x != '']
                    data_list.append(line_temp)

                df = pd.DataFrame(data_list,columns=['年','月','日','小时','温度','露点温度','气压','风向','风速','云量','1小时雨量','6小时雨量'])

                # 对数据中-9999的缺失值进行NaN替换
                df = df.replace(-9999,np.nan)

                # 数据说明文档中表示原始数据中温度、露点温度、气压、风速、降雨量的换算系数为10，所以要对原始数据中的对应数据除以10，进行换算。
                df['温度'] = df['温度']/10
                df['露点温度'] = df['露点温度']/10
                df['气压'] = df['气压']/10
                df['风速'] = df['风速']/10
                df['1小时雨量'] = df['1小时雨量']/10
                df['6小时雨量'] = df['6小时雨量']/10

                # 为了便于后续重采样分析数据，给数据增加一个DataFrame列
                df['Date'] = pd.PeriodIndex(year=df['年'],month=df['月'],day=df['日'],hour=df['小时'],freq='H')
                df = df.set_index(df['Date'])
                df.drop(columns= 'Date',inplace=True)

                # 保存为同名excel
                out_folder = f'{work_dir}_trans_isd2excel\\{os.path.split(name)[-1][-4:]}' # 输出到工作文件夹同级的 "工作文件夹名称 + _trans_isd_2excel"下
                if not os.path.exists(out_folder):
                    os.makedirs(out_folder)                 # 如果文件夹不存在，就创建 
                df.to_excel(f'{out_folder}\\{os.path.split(name)[-1]}.xlsx')
            except FileNotFoundError:
                print("Error: 没有找到文件或读取文件失败",name)
                erro_list.append(name)
            else:
                print("/"*10,"成功！",name)
    return erro_list  # 返回一个列表（储存未找到的文件名称）

2.工作过程

上述代码定义了一个名为“trans_isd2excel”的函数

要求输入：station_list，站点列表，[455001,455002,…]

work_dir，工作文件夹路径

period，处理时间范围，[起始年份，结束年份]

2.1输入

~工作文件夹路径，就是包含各年份文件夹的上级文件夹路径

本例中，包含年份文件夹的 "D:\A_NCDC_test"就是工作文件夹work_dir；

~处理时间范围，这个也好理解，我工作文件夹下有1980-2022，但我只想要1980-2018，那么就设置period=[1980,2018]；

~需要说明的是，站点列表station_list在上一篇文章里没有处理到位，这里要多做一步；

红框中只有前6位是站编号，后面一串9需要去除，代码中的

stations = pd.read_excel('../Desktop/station_ID.xlsx')        
station_list = [str(x)[:6] for x in stations["STATION_ID"]]        # 有效站点列表

就是负责做这个的

2.2过程

step1. 根据输入的时间范围，创建对应的年份文件夹列表

datadir_list = ['D:\\A_NCDC_test\\china_isd_lite_1980',…]

step2.根据输入的站点列表，创建文件名称列表，
dataname_list = ["D:\\A_NCDC_test\\china_isd_lite_1980\\450070-99999-1980",…]

step3.顺序读取文件名称列表对应文件，完成数据折算及写入

对于step1中每一个年份文件夹，都执行step2和step3，转换后的文件最终输出到工作文件夹同级的 "工作文件夹名称 + _trans_isd_2excel"下，如本例中，工作文件夹为D:\\A_NCDC_test，输出文件夹就为D:\\A_NCDC_testtrans_isd_2excel。

3.实际效果

调用函数

trans_isd2excel(station_list,work_dir= r"D:\A_NCDC_test",period= [1980,1981])

输出文件位置，

MD5密码实验——Python实现(完整解析版)

文章目录更新：前言实验环境实验内容实验操作步骤1.初始化四个缓冲区2.设置常数表、位移位数等参数3.增加填充4.分组处理5.输出处理实验结果实验心得实验代码MD5-Python.py更新： 感谢评论区的大佬指出错误，现已改进代码之前的错误在于没有考…...

编程日记 2024/5/5 8:46:11

如何在vscode中下载python第三方库（jieba和wordcloud为例）

本文由来本来我并不想写文章的，但是我发现，对于一个0基础的小白vscode用户而言，想完整的下载一个第三方库还是存在一定的问题，并且我在搜索文章的时候发现，完全没有小白教程，太难了，所以说我就…...

编程日记 2024/5/5 7:16:00

python安装使用pip安装numpy

相信大家最近都在忙，因为到开学和上班的时候了，我最近也很忙，忙的快要流泪，这不是要考计算机三级了吗！买了好厚一本书，备战过程中，最近洗头一次掉了100根不止的头发，有点恐惧&#x…...

编程日记 2024/5/5 4:28:11

yolov5ds-断点训练、继续训练、先终止训练并调整最终epoch（yolov5同样适用）

目录参考链接1. 训练过程中中断了，继续训练如果觉得数值差不多稳定了，但是距离最终设置的epoch还很远，所以想要停止训练但是又得到yolov5在运行完指定最大epoch后生成的一系列map、混淆矩阵等图2. 训练完原有epoch，但还继续训练&a…...

编程日记 2024/5/5 7:42:46

openCV第一篇

文章目录前言：计算机眼中的图片 1. 图片的读取与显示 1.1 图片的读取 1.2 显示的图片 1.2.1 显示原始图片 1.2.2 灰度图 1.3 BGR转换成灰度图、RGB 2. 保存图片 3. 视频的读取与显示 4. 截取图像部分 5. 颜色通道提取 6. 边界填充 7. 数值计算 8.…...

编程日记 2024/4/22 14:49:18

基于Python构建机器学习Web应用

目录一、内容介绍 1.Onnx模型 ①skl2onnx库安装 2.Netron安装二、模型构建 1.数据加载 2.划分可训练特征与预测标签 3.训练模型 ①第三方库导入 ②数据集划分 ③SVC模型构建 ④精度评价二、模型转换及可视化 1.参数配置 2.Onnx模型生成 3.可视化模型四、构…...

编程日记 2024/4/22 14:49:18

python - 密码加密与解密

Python之密码加密与解密 - 对称算法一、对称加密1.1 安装第三方库 - PyCrypto1.2 加密实现二、非对称加密三、摘要算法3.1 md5加密3.2 sha1加密3.3 sha256加密3.4 sha384加密3.5 sha512加密3.6 “加盐”加密由于计算机软件的非法复制，通信的泄密、数据安全受到威胁。…...

编程日记 2024/4/22 14:49:18

百度飞桨PaddleSpeech的简单使用

PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型，一些典型的应用示例如下：语音识别、语音翻译 (英译中)、语音合成、标点恢复等。…...

编程日记 2024/5/5 6:32:20

Python数据标准化

目录一.数据标准化方式 1.实现中心化和正态分布的Z-Score 2.实现归一化的Max-Min 3.用于稀疏数据的MaxAbs 4.针对离群点的RobustScaler 二.Python针对以上几种标准化方法处理数据三.总结一.数据标准化方式 1.实现中心化和正态分布的Z-Score Z-Score标准化是基于原…...

编程日记 2024/5/5 6:48:46

Pycharm无法下载汉化包，一招教你搞定

Pycharm无法下载汉化包，一招教你搞定Pycharm直接导入汉化包Pycharm 无法采用自带的插件安装汉化包Pycharm直接导入汉化包 Pycharm 是可以直接导入汉化包的，这为很多初学者省区了不少麻烦。具体就是： 1：点击pycharm界面右上角的设…...

编程日记 2024/4/22 14:49:19

python成功实现“高配版”王者小游戏？【赠源码】

前言嗨喽~大家好呀，这里是魔王呐 ❤ ~! 本游戏完整源码、素材: 点击此处跳转文末名片获取咳咳，又是一款新的小游戏，就是大家熟悉的王者~ 来看我用python来实现高（di）配版的王者是一款拿到代码运行后，…...

编程日记 2024/5/5 8:43:12

【项目实战】Python实现多元线性回归模型(statsmodels OLS算法)项目实战

说明：这是一个机器学习实战项目（附带数据代码文档视频讲解），如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景回归问题是一类预测连续值的问题，而能满足这样要求的数学模型称作回归模型，本项…...

编程日记 2024/5/5 6:09:04

graphviz安装教程（2022最新版）初学者适用

1、首先在官网下载graphviz 下载网址：https://www.graphviz.org/download/ 2、安装。打开第一步已经下载好的软件。点击下一步，在安装路径选择时可将安装路径修改为 D:\graphviz 接着一直点下一步，即可安装完成。 3、配置环境变量右键…...

编程日记 2024/5/5 5:21:03

【Windows】搭建Pytorch环境(GPU版本，含CUDA、cuDNN)，并在Pycharm上使用（零基础小白向）

文章目录前言一、安装CUDA1、检查电脑是否支持CUDA2、下载并安装CUDA3、下载并安装cuDNN二、安装Pytorch1、安装Anaconda2、切换清华镜像源3、创建环境并激活4、输入Pytorch安装命令5、测试三、在Pycharm上使用搭建好的环境参考文章前言本人纯python小白，第一次使用…...

编程日记 2024/4/22 14:49:19

Tensorflow与CUDA、cudnn版本对应关系

不同版本的Tensorflow需对应不同的CUDA和cudnn版本，否者容易安装失败。可按下图所示，根据想要安装的Tensorflow版本，选择对应版本的CUDA和cudnn。其中CUDA的下载链接为： CUDA Toolkit Archive | NVIDIA Developer cudnn下载链…...

编程日记 2024/5/5 4:30:31

ImportError: cannot import name ‘Literal‘ from ‘typing‘ (D:\Anaconda\envs\tensorflow\lib\typing.py)

报错背景： 因为安装tensorflow-gpu版本需要，我把原来的新建的anaconda环境（我的名为tensorflow）中的python3.8降为了3.7。在导入seaborn包时，出现了以下错误： ImportError: cannot import name Literal …...

编程日记 2024/4/30 8:03:55

100天精通Python（数据分析篇）——第67天：Pandas数据连接、合并、加入、添加、重构函数（merge、concat、join、append、stack、unstack）

文章目录一、数据连接（pd.merge）1. left、right2. how3. on4. left_on、right_on5. sort6. suffixes7. left_index、right_index二、数据合并（pd.concat）1. index 没有重复的情况2. index 有重复的情况3. DataFrame合并时同时查看行索引和列索引有无重复三、数据加入（pd.…...

编程日记 2024/4/26 16:55:01

yolov5 优化系列（三）：修改损失函数

1.使用 Focal loss 在util/loss.py中，computeloss类用于计算损失函数 # Focal lossg h[fl_gamma] # focal loss gammaif g > 0:BCEcls, BCEobj FocalLoss(BCEcls, g), FocalLoss(BCEobj, g)其中这一段就是开启Focal loss的关键！！&…...

编程日记 2024/4/28 9:01:32

Python中数组切片的用法详解

Python中数组切片的用法详解一、python中“::-1”代表什么？二、python中“:”的用法三、python中数组切片三、numpy中的整数数组索引四、numpy中借助【切片 : 或 …与索引数组】组合进行复杂切片五、布尔索引六、花式索引一、python中“::-1”代表什么？ …...

编程日记 2024/5/5 7:59:33

python 安装whl文件

前言 WHL文件是以Wheel格式保存的Python安装包，Wheel是Python发行版的标准内置包格式。在本质上是一个压缩包，WHL文件中包含了Python安装的py文件和元数据，以及经过编译的pyd文件，这样就使得它可以在不具备编译环境的条件下&#…...

编程日记 2024/4/22 14:49:20

Pycharm中安装pytorch

配置虚拟环境为什么要安装虚拟环境？虚拟环境：把一部分内容独立出来，称之为容器。在容器中，安装我们自己想要的东西，比如不容版本的依赖包。各容器之间相互独立，互不影响。比如下载完 Anaconda 之后&#…...

编程日记 2024/4/22 14:49:20

Package | 解决 module ‘cv2‘ has no attribute ‘gapi_wip_gst_GStreamerPipeline‘

. 问题背景由于这个问题出现了两回，决定记录一下。实验背景是使用opencv python库进行数据预处理，遇到报错信息如下： “ import cv2 File “/opt/conda/lib/python3.8/site-packages/cv2/init.py”, line 181, in bootstrap() File “/op…...

编程日记 2024/4/26 23:34:27

如何在项目中搭建python接口自动化框架？

文章目录前言一、框架目录介绍1、common模块读取Excel代码读取yaml代码（支持场景关联）jsonpath断言封装代码requests二次封装（get、post）configparser读取配置文件递归遍历字典常用方法log日志封装2、conf模块3、data模块4、case模…...

编程日记 2024/5/5 8:54:24

应用统计432考研复试复试提问总结精简版【一】

一、区间估计与假设检验的联系与区别联系：二者利用样本进行推断，都属于推断统计区别： 原理： 前者是基于大概率，后者基于小概率；统计量：前者是构造枢轴量（不含未知参数，…...

编程日记 2024/5/5 7:24:20

Pytorch模型量化

在深度学习中，量化指的是使用更少的bit来存储原本以浮点数存储的tensor，以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点： 更少的模型体积，接近4倍的减少；可以更快的计算，由于…...

编程日记 2024/5/5 6:53:40

已解决Encountered error while trying to install package.＞ lxml

已解决（pip安装第三方模块lxml模块报错）Building wheels for collected packages: lxml Building wheel for lxml (setup.py) … error error: subprocess-exited-with-error python setup.py bdist_wheel did not run successfully. note: This error o…...

编程日记 2024/5/5 5:06:31

距离度量 —— 闵可夫斯基距离(Minkowski Distance)

Python学习系列文章：👉 目录 👈 文章目录一、概述二、计算公式1. 闵氏距离公式2. 闵氏距离的参数 p3. 闵氏距离的缺点一、概述闵可夫斯基距离 (Minkowski Distance)，也被称为闵氏距离。它不仅仅是一种距离，而是将多…...

编程日记 2024/4/22 14:49:21

python（模块）xlwt

目录一、xlwt简介二、xlwt语法1、模块安装2、模块导入3、向xls文件中写入内容4、设置写入文件的格式4.1 字体设置（font）4.2 背景颜色设置（pattern）4.3 边框设置（borders）4.4 对齐方式设置（align…...

编程日记 2024/5/5 6:53:16

Pytorch中torch.unsqueeze()和torch.squeeze()函数解析

一. torch.squeeze()函数解析 1. 官网链接 torch.squeeze()，如下图所示： 2. torch.squeeze()函数解析 torch.squeeze(input, dimNone, outNone) squeeze()函数的功能是维度压缩。返回一个tensor（张量），其中 input…...

编程日记 2024/5/3 0:32:12

python绘制相关系数热力图

python绘制相关系数热力图一.数据说明和需要安装的库二.准备绘图三.设置配色，画出多幅图全部代码：本文讲述如何利用python绘制如上的相关系数热力图一.数据说明和需要安装的库数据是31个省市有关教育的12个指标，如下所示。，在文…...

编程日记 2024/4/14 12:13:53

DeepSpeed使用指南(简略版)

现在的模型越来越大，动辄几B甚至几百B。但是显卡显存大小根本无法支撑训练推理。例如，一块RTX2090的10G显存，光把模型加载上去，就会OOM，更别提后面的训练优化。作为传统pytorch Dataparallel的一种替代，D…...

编程日记 2024/5/4 15:06:59

【Python】tqdm 介绍与使用

文章目录一、tqdm 简介二、tqdm 使用1. 基于迭代对象运行: tqdm(iterator)2. tqdm(list)3. trange(i)4. 手动更新参考链接一、tqdm 简介 tqdm 是一个快速，可扩展的 Python 进度条，可以在 Python 长循环中添加一个进度提示信息，用户只需要封装…...

编程日记 2024/4/30 15:22:58

Pytorch机器学习（十）—— 目标检测中k-means聚类方法生成锚框anchor

Pytorch机器学习（十）—— YOLO中k-means聚类方法生成锚框anchor 目录 Pytorch机器学习（十）—— YOLO中k-means聚类方法生成锚框anchor 前言一、K-means聚类 k-means代码 k-means算法二、YOLO中使用k-means聚类生成anchor 读取VO…...

编程日记 2024/4/19 22:11:54

Python的占位格式符

对于print函数里的语句 print("我的名字是%s, 年龄是%d"%(name, age)) 中的%s和%d叫做占位符，它们的完整形态是 %[(name)][flags][width][.precision]typecode 其中带有[]的前缀都是可以省略的。 [(name)]: (name)表示, 根据, 制定的名称(…...

编程日记 2024/4/22 2:10:09

关于sklearn库的安装

对于安装sklearn真的是什么问题都被我遇到了例如pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(hostfiles.pythonhosted.org, port443): Read timed out.遇到了这种也遇到了Requirement already satisfied: numpy in c:\users\yjq\appdata\roamin…...

编程日记 2024/4/22 5:08:17

accuracy_score函数

1.acc计算原理 sklearn中accuracy_score函数计算了准确率。在二分类或者多分类中，预测得到的label，跟真实label比较，计算准确率。在multilabel（多标签问题）分类中，该函数会返回子集的准确率。如果对于一…...

编程日记 2024/4/21 12:47:35

怎么成为稚晖君？

如何成为IT大佬稚晖君——电子系统设计应具备的基本技能和方法论快速提高电子技术的必经之路_一些老生常谈的道理嵌入式AI入坑经历稚晖君软件硬件开发环境总结首先，机器学习深度学习这些和硬件是两个领域的内容，个人不建议一起学，注意力…...

编程日记 2024/4/22 0:18:15

Pandas库

Pandas是python第三方库，提供高性能易用数据类型和分析工具。Pandas基于NumPy实现，常与NumPy和Matplotlib一同使用。pandas库引用： import pandas as pd 包括两个数据类型：Series（相当于一维数据类型）&…...

编程日记 2024/4/22 3:42:52

通过两道一年级数学题反思自己

背景做完这两道题我开始反思自己，到底是什么限制了我？是我自己？是曾经教导我的老师？还是我的父母？ 是考试吗？还是什么？ 提目 1、正方体个数问题 2、相碰可能性过程静态思维： …...

编程日记 2024/4/5 3:49:36

深度学习—卷积神经网络（CNN）全笔记，附代码

本文内容为哔站学习笔记【卷积神经网络-CNN】深度学习（唐宇迪带你学AI）：卷积神经网络理论详解与项目实战，计算机视觉，图像识别模块实战_哔哩哔哩_bilibili 目录深度学习基础什么是深度学习？ 机器学习流…...

编程日记 2024/4/28 23:05:41

Building wheel for mmcv-full (setup.py) ... error解决办法！

mmdetection 安装后，根据官方给的程序安装mmcv时，出现：Building wheel for mmcv-full (setup.py) … error 环境：CUDA11.3, Pytorch1.11 安装根据官网给的安装程序：pip install mmcv-full -f https://download.openmm…...

编程日记 2024/4/25 3:21:08

联邦学习开山之作代码解读与收获

参考：联邦学习代码解读，超详细_一只揪的博客-CSDN博客_联邦学习代码参考文献：[1602.05629] Communication-Efficient Learning of Deep Networks from Decentralized Data (arxiv.org) 参考代码：GitHub - AshwinRJ/Federated-L…...

编程日记 2024/4/23 23:22:49

Python安装第三方库常用方法超详细~

Python安装第三方库常用方法前言安装方法1. 通过pychram安装2. pip安装大法3. 下载whl文件到本地离线安装3.1 补充4.其他方法4.1 Python官方的Pypi菜单4.2 国内镜像源解决pip安装过慢的问题小结前言在pyhton的学习中，相信大家通常都会碰到第三方库的安装问题&…...

编程日记 2024/4/26 23:32:18

Python--找出字符串中出现次数最多的字符及其出现的次数

方法一： 1、循环遍历列表或字符串，如果字符在字典中则值加1，如果不在则创建（key,value) 2、找到字典中，最大的value值 3、根据最大的value值，找对应的key值，打印出出现次数最多的字符 str &qu…...

编程日记 2024/4/23 17:36:09

滤波笔记一：卡尔曼滤波（Kalman Filtering）详解

本笔记是总结了B站DR_CAN的卡尔曼滤波器的课程，他的B站主页为：DR_CAN的个人空间_哔哩哔哩_bilibili PS:虽然我不是学自控的，但是老师真的讲的很好！ 目录 Lesson1 递归算法 Lesson2 数学基础_数据融合_协方差矩阵_状态空间方程…...

编程日记 2024/4/29 0:51:11

利用Python求斐波那契数列的第N项以及前N项和（循环、递归、集合）

著名的斐波那契数列，即从第三项开始，每一项都等于前两项之和。之前写过利用Java语言来编写，由于最近正在学Python，所以将自己的想法记录在此，有需要的朋友可以参考一下。写在前面：这里的三个方法其实思…...

编程日记 2024/4/28 14:53:17

一文速学(十八)-数据分析之Pandas处理文本数据(str/object)各类操作+代码一文详解(三)

目录前言一、子串提取提取匹配首位子串提取所有匹配项（extractall）...

编程日记 2024/4/29 23:32:36

Python数据分析-数据预处理

数据预处理文章目录数据预处理1.前言2.数据探索2.1缺失值分析2.2 异常值分析2.2.1 简单统计量分析2.2.2 3$\sigma$原则2.2.3 箱线图分析2.3 一致性分析2.4 相关性分析3.数据预处理3.1 数据清洗3.1.1 缺失值处理3.1.2 异常值处理3.2 数据集成3.2.1 实体识别3.2.2 冗余属性识别3…...

编程日记 2024/4/23 3:07:00

【Python】AES加解密代码，文章还有加密串等你来解密，等你来挑战

🍦🍦写这篇AES文章也是有件趣事，有位小伙伴发了段密文，看看谁解密速度快，学过Python的小伙伴一下子就解开来了，内容也挺有趣的。 🍟🍟原来加解密也可以这么有趣，虽然看起…...

编程日记 2024/4/26 7:25:59

朴素贝叶斯模型及案例（Python）

目录 1 朴素贝叶斯的算法原理 2 一维特征变量下的贝叶斯模型 3 二维特征变量下的贝叶斯模型 4 n维特征变量下的贝叶斯模型 5 朴素贝叶斯模型的sklearn实现 6 案例：肿瘤预测模型 6.1 读取数据与划分 6.1.1 读取数据 6.1.2 划分特征变量和目标变量 6.2 模型…...

编程日记 2024/5/4 12:03:31

1.完整代码（部分代码参考https://zhuanlan.zhihu.com/p/556150264）

2.工作过程

2.1输入

2.2过程

3.实际效果

相关文章：