数据集​

为企业提供更高精度的优质数据集下载

人体标注

人体骨骼关键点检测 | 上半身人像数据集 | 人形轮廓图像 …
Buffy Stickmen Dataset V3 是一个包含人物图像和躯干标注数据,用以识别图像中的人物轮廓,以头,躯干,左右大臂,左右小臂6个线段表示人体轮廓。
MPII Human Shape 人体模型数据是一系列人体轮廓和形状的3D模型及工具。模型是从平面扫描数据库 CAESAR 学习得到。

人脸标注

Bao Face 人脸数据 | CMU Frontal Face Images 图像数据 …
BaBao Face 是一个人脸数据集,人脸关键点标注,对人脸范围内的关键点进行标注和微调,每个点有准确的位置,用于精密的表情变化和人脸关键点识别。
CMU Frontal Face Images 是一个正面人脸灰度图像以及人脸位置标注的数据集,虽然人脸图像不多约 180张,但有详细的人脸位置标注信息。
人脸关键点标定竞赛,为图像中的人脸标定15个关键位置点,图像时96×96像素的,每个关键点对应一个二维位置坐标用以标识关键点的位置。

音频标注

暂无

图像标注

17_Category_Flower 图像数据 | COIL-20 数据集 …
17_Category_Flower 是一个不同种类鲜花的图像数据,包含 17 不同种类的鲜花,每类 80 张该类鲜花的图片,鲜花种类是英国地区常见鲜花。
COIL-20 数据集是彩色图片集合,包含对 20 个物体从不同角度的拍摄,每隔 5 度拍摄一副图像,每个物体 72 张图像。每张图像大小进行了统一处理为 128×128。
MNIST是最受欢迎的深度学习数据集之一,这是一个手写数字数据集,包含一组60,000个示例的训练集和一个包含10,000个示例的测试集。这是一个很好的数据库,用于在实际数据中尝试学习技术和深度识别模式,同时可以在数据预处理中花费最少的时间和精力。

医疗标注

UCI Beast-cancer 数值化数据集(breast-cancer-wisconsin) …
UCI Beast-cancer 数值化数据集(breast-cancer-wisconsin)

自然语言处理

Quora Question Pairs 问答数据集 …
美国知识问答网站 Quora 上的问题答案数据集,可用以进行重复问题检测。
Stanford Sentiment Treebank 是一个由斯坦福大学标注的语义词汇数据,人工标注了9645个英语句子的语义树结构。

市场与社交媒体

美国股票新闻数据 …
从Reddit WorldNews Channel网站上抓取的新闻数据(2008-06-08 到 2016-07-01)和对应时间的 Dow Jones Industrial Average (DJIA)股票指数数据。

建模与机器学习

NIPS 2003 |UCI Breast Cancer 数值化二分类建模数据 …
NIPS 2003 workshop feature extraction 属性选择竞赛数据,包含5个属性(列数)较大的数据集,用以对属性选择(Feature Selection)或属性提取(Feature Extraction)算法的效能进行评判。
UCI 数据集中的几个 Large-scale 大规模分类建模数据,名称为 SUSY、HIGGS,用以测试分类算法的时间和空间复杂度。
利用 UCI 机器学习数据集合中的多分类数据集,排列组合出的二分类数据集,用以测试二分类模型的预测效果。
UCI 机器学习数据集合中的经典二分类数据集,包括 Iris、Hert Dieses、German Credit 等经典二分类问题测试数据集。