设为首页 加入收藏
  精选图片
  精彩视频
10万以内性价比最高的女性用
1000块的吉他和5000块的吉他比
1040阳光工程是否就是庞氏骗局
007幽灵党片头的骷髅巡游在墨
100名知乎用户身穿现代肉联厂
0betaCAPM的意义是什么
1080p和720p的H264视频在文件大小
09年后NBA魔术队为什么衰落了
100名知乎用户身穿现代肉联厂
100字以内可以写出怎样的武侠
  旅游  
1000元的自行车和2000元的差 
007幽灵党片头的骷髅巡游 
100字以内怎样能写出结局 
08款18L卡罗拉油耗夏天一公 
10086的短信评价系统有多大 
100名知乎用户身穿现代肉 
10Hz的声音就算响度达到 
当前位置:主页 > 旅游 >

10万域名求自建DNS解决方案

2019-11-07 14:22:59

题主应该是在域名注册商所在的公司上班吧。很有幸我主导过超大型第三方dns开发(CloudXNS-免费智能DNS解析服务),支持海量域名,100多条解析线路,还有很多私有记录,整体系统工作得很好。我介绍下cloudxns其中系统架构的衍化过程,应该能减少题主的弯路。2009-2011年,我所处在的CDN公司有不少CDN客户将DNS解析直接托管给我们,和CDN的权威DNS混在一块管理(此时CDN的权威DNS也是用BIND),这样的托管数量少没有问题,数量多了1)影响CDN调度解析数据的下发速度,2)也容易产生管理混乱,3)由于没有用户界面,客户用邮件形式通知修改,实际修改由运维同事处理,增加运维工作量。2011-2012年,域名托管数量一直在增加,我们团队就开始着手对这类业务拆分到一个新项目cloudxns。起初,我们用BIND+DLZ+NOTIFY+AXFR来做底层支撑,DLZ是让BIND从数据库动态读取解析配置的一个模块。BIND+DLZ会让DNS解析查询性能下降到不用DLZ的1/10甚至更多(4-5KQPS),但为了给用户提供一个WEB界面,有个数据库的底层支撑会节省很多工作量,因此我们只用BIND+DLZ做master,仅提供SLAVE的AXFR复制查询,不对外提供实际DNS解析查询;DLZ的mysql数据和WEB系统打通,WEB系统将用户填写的数据实时写到mysql,然后出发notify通知SLAVE自动化过来AXFR拉取新版本的DNS配置文件。这个第一个版本的CloudXNS系统做到了:1)客户自助解析2)“实时生效”(域名*线路少时候1分钟之内,域名*线路多就不确定了)3)SLAVE的性能没有打任何折扣(10万-20万QPS)本来以后可以就此打住了,但是这样架构仅仅支撑了半年,我们又开始进行了新的征程。原因:1)既然已经有成型的产品,而且原有域名托管用户转到自助的CloudXNS上还总体比较满意。2)恰恰中国云计算市场在此时开始高歌猛进布道之时,做为网络入口的域名解析,开始成为各大巨头要争的战略要地。那么CloudXNS也就被顺利成章包装出去运营,接来下用户数量进一步增加,域名解析行业无法绕过的劫数,黑客军团的时不时利用DDOS攻击也开始向我们“宣战”了。BIND+DLZ+NOTIFY+AXFR方案什么时候会停摆挂掉,一直是像高悬在我们头顶一把利剑。2012-2013年,我经过一段时间的痛苦挣扎和不断反思,终于决定要放弃BIND,重新实现一个海量第三方域名解析服务器。BINDVIEW*ZONE模型,也就是线路*域名的意思,线路多了,数据冗余很大,如何降低冗余,提高zone_transfer效率,比如很多用户整个东北地区都是一个解析,但有少部分用户东北每个省有各自的解析,那么多大部分用户按VIEW*ZONE进行zone_transfer将有大量的重复冗余数据。要解决的问题(这些问题限于篇幅我就不讲了解决的细节了,大家有兴趣可以登录CloudXNS-免费智能DNS解析服务):1)如何组织用于解析配置传输的数据结构模型最有效2)如何实现界面配置后秒级生效,更重要的是如何做到和托管的数量级没有关系3)如何实现一个兼容超精细解析(省*运营商)和普通精细解析(到运营商级别)用户需求的系统。4)如何将DNS性能大幅提高,尽量逼近网卡限速。技术选型:1)内核模块,(当初的想法是:路由器那么高的性能,为什么不能把dns服务器当路由器来做?)2)dpdk(intel刚刚推出的新技术,不是第一个吃螃蟹,也是第一批没有先后的吃螃蟹人)综合各因素和团队成员,我们最终选型是用内核模块来实现下一版本的CloudXNS服务器。经过整个团队(加我自己,3个C工程师+1.5PHP工程师)3个月的连续奋战,我们顺利攻克了各个问题并成功上线,做到了当时国内的各项指标的极致。1)生效速度(解析填写到权威解析生效),0.5秒2)解析配置线路可伸可缩,兼容精超细解析需求和普通精细解析用户(支持线路130多个)3)单机性能到达350万QPS(实际业务环境由于加了其他一些功能,有所下降)2014-2015软件上没有进行大架构调整,仅进行产品功能迭代,界面改版。开始安排专业运营人员进行运营,知名度也慢慢起来了,有大量知名互联网企业大量使用CloudXNS。此时由于用户量增加(50亿次解析量每天),攻击的规模和频次大幅攀升,这时DPDK技术也开始成熟起来了,CloudXNS也开始着手DPDK版本的研发,毕竟内核模块的性能还没有到达网卡限速,而DPDK更容易达到这个目标,这也是抗攻击的最大手段了(除了增加服务器之外)。2015-2016再后来我离开了这家公司,我原来的团队在继续努力,做的还不错(快100亿每天的解析量了)。

上一篇:0基础应该如何自学音乐制作
下一篇:02年韩日世界杯中意大利黑手党对韩国队的表现能容忍下去么不会采取什么措施么