分享发现数据集

因为分享所以简单 — AIhub 致力于让人工智能更简单

Microsoft Malware Classification Challenge
Classify malware into families based on file content and characteristicshttps://www.kaggle.com/c/malware-classification
IMDB 电影数据仓库
IMDB 电影数据仓库数据,包括电影名称、介绍、导演、演员等信息,数据更新至2017年9月。
IJB-B NIST 人脸数据集
由于美国国家标准化研究院(NIST)发布的大型人脸数据集,包括从互联网采集的静态人脸图像和视频,共有1845个对象,11754张图片,55026视频帧,7011个视频和10044非人脸图像。该数据集在采集上与其它流行的人脸数据集不重叠,如:牛津大学VGG人脸数据集Face Challenge、CASIA WEBFace数据集等。数据集被用于NIST举办的 Face Challenge 竞赛,进行校验、搜索、检测、聚类、标注等人脸识别任务。
高速公路车辆视频数据
Highway Traffic 是一个高速公路车辆视频数据集,http://visal.cs.cityu.edu.hk/downloads/
FaceWarehouse 人脸 3D 建模数据集
FaceWarehouse是一个人像3D面部表情的数据库。使用Kinect RGBD摄像机拍摄了来自不同种族150位年龄在7-80岁的人脸。 每个人包括中性和19个其它面部表情,如开嘴,微笑,吻等。http://gaps-zju.org/facewarehouse/
商场人群数量识别视频数据集
该数据是从商场监控视频中人工标注的行人,从 2000 副视频帧标注了 60000名行人。http://personal.ie.cuhk.edu.hk/~ccloy/downloads_mall_dataset.html
GENKI 人脸数据集
GENKI 数据集是由加利福尼亚大学的机器概念实验室收集。该数据集包含GENKI-R2009a,GENKI-4K,GENKI-SZSL三个部分。GENKI-R2009a包含11159个图像,GENKI-4K包含4000个图像,分为“笑”和“不笑”两种,每个图片的人脸的尺度大小,姿势,光照变化,头的转动等都不一样,专门用于做笑脸识别。GENKI-SZSL包含3500个图像,这些图像包括广泛的背景,光照条件,地理位置,个人身份和种族等。https://github.com/watersink/GENKI
MegaFace 人脸识别数据库
MegaFace 是一个大型人脸识别图像数据库,人脸图像从  Flickr 数据集中挑选得到。http://megaface.cs.washington.edu/dataset/download.html
根据视频再次识别人身份的数据集
该数据集是一个人身份再识别数据集,用以评价人身份再识别算法的效果。
WIDER 人脸数据集
WIDER Face 是一个人脸数据集,从公开数据集 WIDER 人工选出 32203 张图像和393703个人脸标注。http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/
更多