最近我学习了一些关于数据挖掘的内容,需要学习并使用一些机器学习库。为了便于数据的挖掘、分析和处理,最后选择了 PyTorch 框架,并配合使用 Python 3。 PyTorch is an optimized tensor library for deep learning using GPUs and CPUs.An open source m…
之前一篇文章,我向大家介绍了如何将 netCDF 数据转换并打包为 Google Earth 支持的 KMZ 文件格式的方法。没有看过、并感兴趣的小伙伴们可以去阅读下。 https://www.nousbuild.org/codelab/nc-data-convert-to-kml/ 那么我们能不能不用 Google Earth 的服务,自己搭建一…
我最近需要把 netCDF 中的太阳辐射栅格数据、台站测的太阳辐射数据集等,进行数据可视化的展示。但是由于太阳辐射数据关联性比较单一,因为辐射值就只与时间有关,是一维的。 所以,我觉得想要展示太阳辐射数据,就不可避免的要增加时间轴维度。所以我就想到了使用 Google Earth 进行数据的动态展示。 接下来,我来说一些该怎么把 netCDF 数据…
最近在做一些数据方面的研究,需要处理很多 netCDF 格式(例如 nc 格式、nc4 格式)的栅格数据。 处理这类数据,使用 Python 应该比较简单,虽然 Python 有性能的问题,但是凭借着众多的数据处理库,还是使用 Python 处理 netCDF 数据较为方便。 其中 netCDF4 库是处理 nc 和 nc4 格式数据的基本库,而 …
终于到了《描述统计学入门》的最后一章,抽样分布,你即将可以开始入门机器学习了。 在《描述统计学入门》抽样分布中,你可以学习中心极限定理,抽样分布,以及将概率知识和归一化应用到样本数据集上。 ...
接下来,我们需要好好学习一下正态分布,这是自然社会中最为重要的分布。 在《描述统计学入门》正态分布中,你可以学习概率密度函数(PDF),正态分布和 z 表格。 ...
归一化是处理数据的重要过程,这一过程目的在于将原始数据转化为成熟的数学模型(正态分布、T分布等),便于分析和计算。 在《描述统计学入门》归一化中,你可以学习使用 Z 值将分布转化为标准正态分布,并学习如何使用归一化分布计算比例。 ...
当两组数据的众数、均值、中位数均相同的时候,如何再比较这两组数据呢? 在《描述统计学入门》可变性中,你可以学习如何使用方差和标准差定量分析数据的分布,并学习如何使用箱线图和四分位距找出异常值。 ...
在机器学习中,数据相当重要,可视化之后,就要来找数据的特征了! 在《描述统计学入门》集中趋势的内容中,你可以学习到三种量度:均值、中位数、众数。 ...
在机器学习中,数据相当重要,但是数据就是未整理的信息,我们在研究数据的时候,如果不加以整理和可视化,分析和研究起来是相当枯燥和耗时的。 在《描述统计学入门》数据可视化中,你可以学习到关于:通过创建和解读直方图、柱状图和频数图,学习数据可视化基础知识。 ...