加入收藏 | 设为首页 | 会员中心 | 我要投稿 柳州站长网 (https://www.0772zz.cn/)- 基础存储、数据迁移、云安全、数据计算、数据湖!
当前位置: 首页 > 大数据 > 正文

六个开源数据科学样式

发布时间:2021-06-05 13:38:06 所属栏目:大数据 来源:互联网
导读:开源计算机视觉项目 对计算机视觉专家的需求每年都在稳步增长。它已经确立了自己作为行业领先领域的地位(这对于任何紧跟最新行业趋势的人来说都是不足为奇的)。作为一名数据科学专业人士,有很多事情要做,有很多东西要学。 这里有三个有用的开源计算机视觉
开源计算机视觉项目
对计算机视觉专家的需求每年都在稳步增长。它已经确立了自己作为行业领先领域的地位(这对于任何紧跟最新行业趋势的人来说都是不足为奇的)。作为一名数据科学专业人士,有很多事情要做,有很多东西要学。
这里有三个有用的开源计算机视觉项目,你会喜欢的。
NVIDIA的Few-Shot vid2vid
https://github.com/NVlabs/few-shot-vid2vid
去年我偶然发现了视频到视频(vid2vid)合成的概念,并被它的有效性所震撼。vid2vid本质上是将一个语义输入视频转换为一个超真实的输出视频。从那时起,这个想法已经有了很大的进展。
但是目前这些vid2vid模型有两个主要的限制:
他们需要大量的训练数据
这些模型很难推广到训练数据之外
英伟达viv2vid框架做了有效的进步。我们可以用它来“生成人体运动姿势,从边缘图合成人物,或者把语义标签地图变成实景照片视频。
六个开源数据科学项目
这个GitHub库是一个PyTorch实现,它很少使用vid2vid。你可以在这里查看完整的研究论文(它也在NeurIPS 2019上发表):https://arxiv.org/abs/1910.12713
这是一段由开发者分享的视频,展示了几次拍摄的视频:https://youtu.be/8AZBuyEuDqc
轻量的面部检测器
https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB
这是一个超轻版本的人脸检测模型,一个非常有用的计算机视觉应用。
六个开源数据科学项目
该面部检测模型的大小仅为1MB!我读了几次后才相信。
该模型是基于libfacedetection架构的边缘计算设备的轻量级面部检测模型。该模型有两个版本:
Version-slim (slightly faster simplification)
Version-RFB (with the modified RFB module, higher precision)
Gaussian YOLOv3:一种精确、快速的自动驾驶目标探测器
https://github.com/jwchoi384/Gaussian_YOLOv3
我是自动驾驶汽车的超级粉丝。但是由于各种原因(建筑、公共政策、社区的接受度等),进展缓慢。因此,看到任何框架或算法为这些自动驾驶汽车带来更美好的未来,总是令人振奋的。
六个开源数据科学项目
目标检测算法是这些自动驾驶车辆的核心——我相信你已经知道了。而高精度、快速的推理速度是保证安全的关键。这些都已经存在了好几年了,那么这个项目有什么不同之处呢?
Gaussian YOLOv3架构提高了系统的检测精度,支持实时操作(一个关键方面)。与传统的YOLOv3相比,Gaussian YOLOv3分别将KITTI和Berkeley deep drive (BDD)数据集的平均精度(mAP)提高了3.09和3.5。
其他开源数据科学项目
这篇文章不仅仅局限于计算机视觉!正如我在引言中提到的,我的目标是覆盖数据科学的所有方面。因此,这里有三个项目,从自然语言处理(NLP)到数据可视化!
Google的T5:Text-to-Text Transfer Transformer
https://github.com/google-research/text-to-text-transfer-transformer
谷歌怎么可能每次都被排除在“最新突破”名单之外呢?他们在机器学习、深度学习和强化学习研究上投入了大量资金,他们的研究结果反映了这一点。我很高兴他们不时地开放他们的项目,我们有很多东西可以向他们学习
T5是Text-to-Text Transfer Transformer的简称,它是由迁移学习的概念驱动的。在这个最新的NLP项目中,T5背后的开发人员引入了一个统一的框架,将每个语言问题转换为文本到文本的格式。

(编辑:柳州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读