音视频技术开发周刊 | 154

微信扫一扫,分享到朋友圈

音视频技术开发周刊 | 154

每周一期,纵览音视频技术领域的干货。

新闻投稿:
contribute@livevideostack.com。



内容推荐

5G时代探索互动立体视频信息承载的新可能

5G时代对于视频行业的发展和业务形态将是一个重要的助推,但5G时代带来的改变不只是带宽提升和延迟降低这两个最直接的因素。本次LiveVideoStackCon 2020线上峰会我们邀请到了阿里巴巴高级算法专家盛骁杰,他将介绍在5G时代,视频信息承载将逐步从目前的平面视频形态过渡到信息表达更为丰富的三维视频,而这种过渡中包含的可能性一方面需要我们充分利用5G技术本身的云、边、端架构带来的技术红利,另一方面,也需要我们对于快速发展的三维视觉,AI,AR等技术进行综合性的创新运用,使得视频体验通过可互动的三维信息表达在5G时代不断给用户创造出更多的价值。

https://mp.weixin.qq.com/s/4cA1Cw-c5_cma-NR2Kwi2Q

架构

三个常见的 WebRTC 工作流程

如何将流分成三种单独的工作流类型。

https://www.wowza.com/blog/3-common-webrtc-workflows



传输网络

TCPDUMP 实例-获取网络包的50种方法

TCPDUMP 毫无疑问是最重要的网络分析工具,因为它简单实用,而且功能强大。这篇教程将会教你从 IP、端口、协议、应用层等多方面来获取通信数据包,确保你可以尽可能快的找到你想要的数据。

https://juejin.im/post/5f12938af265da22a92476af

LL-HLS的演进

HTTP实时流媒体,也就是HLS,是苹果为了解决扩展问题在2009年发布的。HLS协议目前成为非常流行的协议并且被广泛应用。和其他基于HTTP的流媒体协议一样,它的最大缺点是延迟。本文讨论了低延迟HLS的出现,变量如何变化,更新如何随时间改变,和它们如何影响流媒体传输。

https://mp.weixin.qq.com/s/bNJoWDeqgAV-1GBPOPB1dg

ProAV新标准IPMX的介绍

本次演讲来自Media-over-IP Education的summer seesions,演讲者是来自ALC NetworkX的Andreas Hildebrand,演讲的主题是介绍IPMX。

https://mp.weixin.qq.com/s/UEl_vEDh-8jonF-PN34RCg

编解码

基于FPGA的高性能视频硬件编码器

基于高性能视频编解码技术的解决方案,可以实现高清画质更快的压缩速度、更少的带宽消耗,在满足用户高清画质要求的前提下有效降低运营成本。阿里巴巴达摩院XG实验室,高级算法专家杨名远在LiveVideoStack线上分享中详细介绍了现有视频编码方案存在的挑战,并对高性能视频硬件编码技术进行了详细解析。

https://mp.weixin.qq.com/s/12qWqb1sAwoJtkzKeuNJlw

AVS3关键技术和uavs3d解码器的简介

数字音视频编解码技术标准(AVS)是中国具有自主知识产权的信源编码标准。AVS基于我国创新技术与部分国际公开技术,采用简便的一站式专利池管理方案,提前规避了后续产业化时潜在苛刻的专利许可问题。AVS3视频编码标准属于第三代AVS标准,主要面向8K、VR和流媒体等视频应用。

https://zhuanlan.zhihu.com/p/161723343?utm_source=wechat_session&utm_medium=social&utm_oi=795383971449040896&from=timeline&s_s_i=OIwExDRYUq%2FIMa1%2FxUxP56AGWF0YhNpv5RjyKgeAJPM%3D&s_r=1

最近很火的最新一代国际视频标准 VVC 到底是什么?阿里专家为你揭秘

在经历了JEM上的三年标准前期技术积累,两年多的标准化,三个重要里程碑,几千篇技术提案,100多个会议工作日,数十个核心实验和专题讨论组一轮又一轮的激烈讨论之后,VVC终于成功诞生!

https://mp.weixin.qq.com/s/EcGA3McH0ezvngQXWXTdYg

HLS和DASH多编解码器的编码和打包

本文来自The broadcast knowledge的演讲,演讲者是FuboTV公司的工程负责人Nick Krzemienski,演讲内容为HLS和DASH多编解码器的编码和打包。

https://mp.weixin.qq.com/s/5TbJKCfa0M-AanBTNQYByQ



音视频技术

QQ音乐听歌识曲系列之一

本文为听歌识曲技术分享系列之一,走进一直以来受到用户广泛使用和好评的QQ音乐听歌识曲,及其背后原理。

https://mp.weixin.qq.com/s/MUtYacgaVKHjBqaGsRFJfA

视频生产环境下的音视频解决方案

随着云剪辑、云导播、音视频生产在线协作的兴起, 生产环境下的音视频处理越发为人所关注。音视频处理在生产环境下,对控制精准性有着更高的要求。从服务端到客户端,精准的时间控制、画面控制都是生产环境音视频和分发环境下音视频处理的重要区别。服务端与客户端的协同上,容易产生微小的差异。

https://mp.weixin.qq.com/s/eUQRA4giJHbqyxFmI3luYg

音视频常见问题分析和解决:HLS切片丢帧引起的视频卡顿问题排查

视频卡顿引起的原因很多,一般分为两大类:一类是因为音视频时间戳打的不规范导致视频在解码渲染时顺序不对引起的;另外一大类就是视频传输过程中因为网络问题导致的丢包进而产生的花屏和卡顿问题。一般具体问题需要具体分析,但是思路差不多。

https://mp.weixin.qq.com/s/CR_B1cH3EKTgjO8jbWei4w

AI智能

阿波罗登月51周年!程序员用DAIN技术还原阿波罗登月高清影像,效果震撼

7月20日是阿波罗登月51周年。一位YouTube名为DutchSteamMachine的程序员使用AI技术修复了阿波罗登月的原始影像,将登月镜头的像素从每秒12帧提升到每秒60帧,效果令人震撼。

https://mp.weixin.qq.com/s/OEc1zcUNlIERUgQY1SNJpw

可视化解释以及在DNN/CNN/RNN中的应用

深入了解DNNs,CNNs以及RNNs中的Dropout来进行正则化,蒙特卡洛不确定性和模型压缩的方法。

https://mp.weixin.qq.com/s/cSLXZN3BdLbnkGBLoG_uTg

一种基于机器学习的图像编码方法

如何有效减少压缩伪像仍然是一个没有完全解决的问题。

https://zhuanlan.zhihu.com/p/161968402?utm_source=wechat_session&utm_medium=social&utm_oi=795383971449040896&from=timeline&s_r=0



图像

下一代图像压缩技术:JPEG XL

本次来自SPIE Digital Library,演讲主题是JPEG XL,下一代图像压缩技术,演讲者是来自Google Research的Luca Versari,介绍了JPEG XL的一些主要编码工具的升级。

https://mp.weixin.qq.com/s/DMv8iVhXt7zHbKCBZvfCHQ

苹果的DTOF中的SPAD原理和特性

本篇文章我们就简单看一下SPAD的一些基本知识。

https://mp.weixin.qq.com/s/DLsmHtUz3gAXMdzNsUTyFA



资源推荐

Fiber

Fiber 是由 Uber 开源的分布式机器学习平台,它可以帮助用户轻松地将本地计算方法扩展到成百上千台机器上。Fiber 可以使使用 Python 的大规模计算项目变得快速、简单和资源高效,从而简化 ML 模型训练过程,并获得更优的结果。

https://github.com/uber/fiber

Leela Zero

由比利时程序员帕斯库托开发的,也是目前少有的完全开放的围棋 AI 项目。

https://github.com/leela-zero/leela-zero



活动推荐

【线上分享】海外超低延时链路设计的挑战与优化实践

7月30日19:30,我们邀请到Zenlayer产品和平台副总裁陈硕,以及Telin Singapore全球业务负责人庄文杰、技术与运营副总裁Sendang,探索不同场景下延时要求、网络架构设计难点与挑战,重点解析海外超低延时链路设计的思路、优化与未来演进方向,并结合东南亚地区分享如何保障高质量流媒体服务的实践经验。

http://livevideostack.mikecrm.com/5tNZybK

31岁的码农放弃月薪4w+的安逸生活,180天来的创业感受

上一篇

雷军喊你报考武汉大学

下一篇

你也可能喜欢

音视频技术开发周刊 | 154

长按储存图像,分享给朋友