抖音直播在线人数越多带宽越高吗

抖音直播在线人数越多带宽越高吗,第1张

如果想要同一时间有数亿人在线,TB级别带宽,CDN加速和多节点,负载均衡等等技术缺一不可。

其实,抖音,百度,阿里云,腾讯都是自建的数据中心,都是TB级别出口带宽(总出口带宽),也就是达到1TB=1024G/s的出口带宽,服务器总署基本都在20万台以上,甚至阿里云都超过了100万台。

据研究,字节跳动(抖音)的数据中心总带宽,可能在10TB级别左右,预期突破15TB级别不远了。

抖音为什么能够供上亿人同时刷?它的带宽有多大?

服务器集群
抖音并不是全国所有刷视频用户都在同一个地方的数据中心接入我们看视频的流量,如果是这样的话,那么这个数据数据中心所需的带宽就是过于巨大。

一般来说,抖音在全国各地会建设几个比较大的数据中心,也就是服务器集群,我们刷视频的请求是就近接入的。

而且每个数据中心都会和三大运营商网络对接。这也就意味着你是如果是上海移动用户,那么刷出来抖音的视频将会从上海移动的网络接入抖音。

抖音为什么能够供上亿人同时刷?它的带宽有多大?
字节跳动有多少台服务器?
根据网络数据整理,字节跳动2017年有2-3万台服务器,这个时候主要是租用服务器为主。2018年,字节跳动自己建设了数据中心,最大的数据中心在河北怀来官厅湖新媒体产业园,一期5万台服务器。二期9万台服务器。

抖音为什么能够供上亿人同时刷?它的带宽有多大?

2018年,租用+自建的服务器数量达到17万台服务器。

2020年,根据字节跳动招聘公告的数据,显示有42万台服务器。比2018年增长了15倍。(数据来自网络)

在海外,例如在美国的TIKTOK(抖音国际版)是独立出来的运营,数据在美国当地存储和分发。2020年TIKTOK在美国也租用了近10万台服务器,占地面积可达数十万平方英尺。

抖音为什么能够供上亿人同时刷?它的带宽有多大?
CDN让视频不卡顿
上面说到服务器集群,再说说CDN等技术,属于是硬性要求,基本都是视频行业的标配了,抖音肯定也不例外。

CDN是做内容分发,用通俗的话解释CDN就是:会把一些页面,专门压缩,有的压缩为静态页面,静态页面直接分发,速度快。用户可以在2s内看到内容,体验感更好。这是静态传输。

对于动态视频,首先通过智能路由,寻找最佳路径,然后协议优化将长连接,内容进行压缩,去除冗余。这就是动态压缩。

抖音为什么能够供上亿人同时刷?它的带宽有多大?

早在2015年腾讯就有5亿日活,集合了音乐,即时通讯等等产品的CDN的级别,达到了10TB带宽。每天请求万亿次。

目前抖音日活有6亿,西瓜视频+今日头条我们粗略算是2亿,总计有8亿的日活。所以,字节跳动整体服务器有10TB只少不多。

所以,拥有这么大的带宽和技术实力,才能让上亿人同时刷视频不卡顿。

通俗的理解是,云计算的“云“就是存在于互联网上的服务器集群上的资源,它包括硬件资源(服务器、存储器、CPU等)和软件资源(如应用软件、集成开发环境等),本地计算机只需要通过互联网发送一个需求信息,远端就会有成千上万的计算机为你提供需要的资源并将结果返回到本地计算机,这样,本地计算机几乎不需要做什么,所有的处理都在云计算提供商所提供的计算机群来完成。

狭义的云计算指的是厂商通过分布式计算和虚拟化技术搭建数据中心或超级计算机,以免费或按需租用方式向技术开发者或者企业客户提供数据存储、分析以及科学计算等服务,比如亚马逊数据仓库出租生意。

广义的云计算指厂商通过建立网络服务器集群,向各种不同类型客户提供在线软件服务、硬件租借、数据存储、计算分析等不同类型的服务。广义的云计算包括了更多的厂商和服务类型,例如国内用友、金蝶等管理软件厂商推出的在线财务软件,谷歌发布的Google应用程序套装等。

应用:

1、云物联

“物联网就是物物相连的互联网”。这有两层意思:第一,物联网的核心和基础仍然是互联网,是在互联网基础上的延伸和扩展的网络;第二,其用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信。

物联网的两种业务模式:MAI(M2M Application Integration), 内部MaaS;MaaS(M2M As A Service), MMO, Multi-Tenants(多租户模型)。

云计算:从计算中心到数据中心在物联网的初级阶段,PoP即可满足需求;在物联网高级阶段,可能出现MVNO/MMO营运商(国外已存在多年),需要虚拟化云计算技术,SOA等技术的结合实现互联网的泛在服务:TaaS (everyTHING As A Service)。

2、云安全

“云安全”通过网状的大量客户端对网络中软件行为的异常监测,获取互联网中木马、恶意程序的最新信息,推送到Server端进行自动分析和处理,再把病毒和木马的解决方案分发到每一个客户端。

扩展资料

云计算技术具有以下特点:

1、可靠性较强

云计算技术主要是通过冗余方式进行数据处理服务。在大量计算机机组存在的情况下,会让系统中所出现的错误越来越多,而通过采取冗余方式则能够降低错误出现的概率,同时保证了数据的可靠性。

2、服务性

从广义角度上来看,云计算本质上是一种数字化服务,同时这种服务较以往的计算机服务更具有便捷性,用户在不清楚云计算具体机制的情况下,就能够得到相应的服务。

3、可用性高

云计算技术具有很高的可用性。在储存上和计算能力上,云计算技术相比以往的计算机技术具有更高的服务质量,同时在节点检测上也能做到智能检测,在排除问题的同时不会对系统带来任何影响。

4、经济性

云计算平台的构建费用与超级计算机的构建费用相比要低很多,但是在性能上基本持平,这使得开发成本能够得到极大的节约。

5、多样性服务

用户在服务选择上将具有更大的空间,通过缴纳不同的费用来获取不同层次的服务。

6、编程便利性

云计算平台能够为用户提供良好的编程模型,用户可以根据自己的需要进行程序制作,这样便为用户提供了巨大的便利性,同时也节约了相应的开发资源。

参考资料百度百科-云计算 

简单描述一下 从硬件和软件的不同分类, 大型的门户网站,在硬件层 可能是由多台服务器组成的集群 而且从数据备份 高可用性 等 都有分别的设置, 对于软件层,对外发布应用服务 需要考虑到数据同步,高可用性 冗余恢复等 网络上还需要考虑电信网通等接入路由问题

简单说,分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。
例如:
如果一个任务由10个子任务组成,每个子任务单独执行需1小时,则在一台服务器上执行改任务需10小时。
采用分布式方案,提供10台服务器,每台服务器只负责处理一个子任务,不考虑子任务间的依赖关系,执行完这个任务只需一个小时。(这种工作模式的一个典型代表就是Hadoop的Map/Reduce分布式计算模型)
而采用集群方案,同样提供10台服务器,每台服务器都能独立处理这个任务。假设有10个任务同时到达,10个服务器将同时工作,10小后,10个任务同时完成,这样,整身来看,还是1小时内完成一个任务!
以下是摘抄自网络文章:
一、集群概念
1 两大关键特性
集群是一组协同工作的服务实体,用以提供比单一服务实体更具扩展性与可用性的服务平台。在客户端看来,一个集群就象是一个服务实体,但事实上集群由一组服务实体组成。与单一服务实体相比较,集群提供了以下两个关键特性:
· 可扩展性--集群的性能不限于单一的服务实体,新的服务实体可以动态地加入到集群,从而增强集群的性能。
· 高可用性--集群通过服务实体冗余使客户端免于轻易遇到out of service的警告。在集群中,同样的服务可以由多个服务实体提供。如果一个服务实体失败了,另一个服务实体会接管失败的服务实体。集群提供的从一个出 错的服务实体恢复到另一个服务实体的功能增强了应用的可用性。
2 两大能力
为了具有可扩展性和高可用性特点,集群的必须具备以下两大能力:
· 负载均衡--负载均衡能把任务比较均衡地分布到集群环境下的计算和网络资源。
· 错误恢复--由于某种原因,执行某个任务的资源出现故障,另一服务实体中执行同一任务的资源接着完成任务。这种由于一个实体中的资源不能工作,另一个实体中的资源透明的继续完成任务的过程叫错误恢复。
负载均衡和错误恢复都要求各服务实体中有执行同一任务的资源存在,而且对于同一任务的各个资源来说,执行任务所需的信息视图(信息上下文)必须是一样的。
3 两大技术
实现集群务必要有以下两大技术:
· 集群地址--集群由多个服务实体组成,集群客户端通过访问集群的集群地址获取集群内部各服务实体的功能。具有单一集群地址(也叫单一影像)是集群的一个基本特征。维护集群地址的设置被称为负载均衡器。负载均衡器内部负责管理各个服务实体的加入和退出,外部负责集群地址向内部服务实体地址的转换。有的负载均衡器实现真正的负载均衡算法,有的只支持任务的转换。只实现任务转换的负载均衡器适用于支持ACTIVE-STANDBY的集群环境,在那里,集群中只有一个服务实体工作,当正在工作的服务实体发生故障时,负载均衡器把后来的任务转向另外一个服务实体。
· 内部通信--为了能协同工作、实现负载均衡和错误恢复,集群各实体间必须时常通信,比如负载均衡器对服务实体心跳测试信息、服务实体间任务执行上下文信息的通信。
具有同一个集群地址使得客户端能访问集群提供的计算服务,一个集群地址下隐藏了各个服务实体的内部地址,使得客户要求的计算服务能在各个服务实体之间分布。内部通信是集群能正常运转的基础,它使得集群具有均衡负载和错误恢复的能力。
二、集群分类
Linux集群主要分成三大类(高可用集群, 负载均衡集群,科学计算集群)
高可用集群(High Availability Cluster)
负载均衡集群(Load Balance Cluster)
科学计算集群(High Performance Computing Cluster)
具体包括:
Linux High Availability 高可用集群
(普通两节点双机热备,多节点HA集群,RAC, shared, share-nothing集群等)
Linux Load Balance 负载均衡集群
(LVS等)
Linux High Performance Computing 高性能科学计算集群
(Beowulf 类集群)
三、详细介绍
1 高可用集群(High Availability Cluster)
常见的就是2个节点做成的HA集群,有很多通俗的不科学的名称,比如"双机热备","双机互备","双机"。
高可用集群解决的是保障用户的应用程序持续对外提供服务的能力。 (请注意高可用集群既不是用来保护业务数据的,保护的是用户的业务程序对外不间断提供服务,把因软件/硬件/人为造成的故障对业务的影响降低到最小程度)。
2 负载均衡集群(Load Balance Cluster)
负载均衡系统:集群中所有的节点都处于活动状态,它们分摊系统的工作负载。一般Web服务器集群、数据库集群和应用服务器集群都属于这种类型。
负载均衡集群一般用于相应网络请求的网页服务器,数据库服务器。这种集群可以在接到请求时,检查接受请求较少,不繁忙的服务器,并把请求转到这些服务器上。从检查其他服务器状态这一点上看,负载均衡和容错集群很接近,不同之处是数量上更多。
3 科学计算集群(High Performance Computing Cluster)
高性能计算(High Perfermance Computing)集群,简称HPC集群。这类集群致力于提供单个计算机所不能提供的强大的计算能力。
31 高性能计算分类 
311 高吞吐计算(High-throughput Computing)
有一类高性能计算,可以把它分成若干可以并行的子任务,而且各个子任务彼此间没有什么关联。象在家搜寻外星人( SETI@HOME -- Search for Extraterrestrial Intelligence at Home )就是这一类型应用。这一项目是利用Internet上的闲置的计算资源来搜寻外星人。SETI项目的服务器将一组数据和数据模式发给Internet上参加SETI的计算节点,计算节点在给定的数据上用给定的模式进行搜索,然后将搜索的结果发给服务器。服务器负责将从各个计算节点返回的数据汇集成完整的 数据。因为这种类型应用的一个共同特征是在海量数据上搜索某些模式,所以把这类计算称为高吞吐计算。所谓的Internet计算都属于这一类。按照 Flynn的分类,高吞吐计算属于SIMD(Single Instruction/Multiple Data)的范畴。
312 分布计算(Distributed Computing)
另一类计算刚好和高吞吐计算相反,它们虽然可以给分成若干并行的子任务,但是子任务间联系很紧密,需要大量的数据交换。按照Flynn的分类,分布式的高性能计算属于MIMD(Multiple Instruction/Multiple Data)的范畴。
四、分布式(集群)与集群的联系与区别
分布式是指将不同的业务分布在不同的地方;而集群指的是将几台服务器集中在一起,实现同一业务。
分布式中的每一个节点,都可以做集群。 而集群并不一定就是分布式的。
举例:就比如新浪网,访问的人多了,他可以做一个群集,前面放一个响应服务器,后面几台服务器完成同一业务,如果有业务访问的时候,响应服务器看哪台服务器的负载不是很重,就将给哪一台去完成。
而分布式,从窄意上理解,也跟集群差不多, 但是它的组织比较松散,不像集群,有一个组织性,一台服务器垮了,其它的服务器可以顶上来。
分布式的每一个节点,都完成不同的业务,一个节点垮了,那这个业务就不可访问了。

如果只是文字聊天 10万人 4台服务够了 2G带宽足够
如果是视频服务器 10万人。。。。得至少12台吧左右,带宽10G
以上是按照最大容量算的…… 如果你去过大型机房


欢迎分享,转载请注明来源:内存溢出

原文地址: http://www.outofmemory.cn/zz/13340254.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-17
下一篇 2023-07-17

发表评论

登录后才能评论

评论列表(0条)

保存