Unbending Notes

采访APLTD主席:博士导师钱华林研究员

sz1961sy 发表于 2002/11/24 19:27:00 阅读全文() | 回复(0) | 引用通告() | 编辑

科技 >> 资料 2002-11-24 19:27:06
打印      发表       
采访APLTD主席:博士导师钱华林研究员

千龙科技   沈阳  

   


    采访时间:2002年10月31日上午  地点:上海国际会议中心3楼

    沈:钱老师,您好!请您谈一下目前IETF确定的多语种域名技术标准有多少种方案,它们各自的支持率是怎样的?

   钱:昨天讨论的是IDN Guide line(注:指多语种域名注册与管理指导方针)。经IETF公布标准有三个:IDNA、Nameprep和 Punycode(注:指做标准化的处理工作)。JET就中日韩三国汉字的特点所提出的Guideline中一部分是技术的,另一部分是针对注册的控制性管理条例。它规定域名在什么情况下可以或不可以注册,在注册时要采取什么样的措施等等。我们希望这一方针也能对其他语种有用,至少是有参考意义。昨天的会议上加拿大人认为他们在做拉丁文的时候可以参考我们的方针,但他们还没有仔细考虑。这一方针这对我们实现中文汉字系统的国际化很有用。我们的汉字有以下几种特征:有不少国家都使用汉字,除中日韩外,还有新加坡等。这些汉字在不同国家使用的方式不同,特别是一些汉字的变体、异体。有时候一个汉字的正体和异体在中国表示同一个意思,而到了日本可能就会出现一体一意的情况,所以我们要与日方进行协调。我们内部也需要协调,这主要是在CDNC(中文域名协调联合会)内部进行。我们内部有着更为复杂的问题亟待解决:如繁简体甚至变体汉字之间的转换。在汉字的简化过程中,表示不同意思的繁体汉字被简化成同一个简体形式,形成多一对应的局面。域名的注册是要保证用户的利益,如果要把相关的字保留下来,就要根据上下文保留一些具有语义的字或词。然而域名系统本身不像搜索引擎,它是严格匹配的,并不处理语义,故此工作的难度很大。目前的这个方针已经可以处理绝大多数这样的问题,但仍无法做到准确度100%。早期外国人不了解中文的这种复杂性,认为中国人总是对他们讨论的结果持不满态度,怀疑我们是故意挑毛病。现在John Klensin等国外专家通过多次参加我们的会议也认识到了这一问题的复杂性。

    沈:CNNIC在2000年1月18日推出测试平台,并在当年11月正式启用。当时CNNIC的政策是"注简送繁",而TWNIC和MONIC则本着"注繁送简"的原则,那么从专业角度看,这是一种市场推广策略还是一种两岸四地的合作模式?当采用IETF或JET的标准化模式时还会衍生出另外一种模式: VeriSign推行的是纯繁体或纯简体中文域名,那么我们现在采用的模式是否是和今后的技术研发存在协调问题?

    钱:我们是通过长时间的协调后才在2000年1月推出的这个测试平台。其间主要是两岸四地(注:指CNNIC、TWNIC、HKNIC、MONIC)进行协调,所以繁简应该是对应的,这样可以避免日后一些无谓的争议。这些繁简对应的汉字虽然数量不多,但使用频率很高,在域名中出现的比率很大。所以我们当时商定,各方在域名注册时均赠送相应的繁体或简体域名形式,这不是为了市场推广,而是出于保护用户利益,今后也要这么做。

   现在国际上IETF批准的这三个标准是我们整个系统中的一部分。这个标准是针对不同语种的,其中一些处理的步骤是通用的。比如说大家都会用到Punycode的转码和Nameprep,以及IDNA(注:指国际化域名A)这种应用层的转换。

    但是正如John Klensin(第六届IAB主席)昨天在会上所谈到的,每种语言还有本地化的问题。我们在本地化中所要做的工作是变体字的转化和等效,所以将来在他们的标准基础上我们还要加入我们中文特有的一层。使用其他语种的技术人员将来也会在其中嵌入他们的特殊一层。所以我们一定要跟踪IETF的标准动向。比如说我们以前底层操作要用UTF-8这种代码,但随着Punycode的出台,我们也要改用Punycode。当然,像繁简和变体汉字的等效是我们要特殊处理的问题,需要我们自己嵌入进去。在我们制定包容2万多汉字的字形等效表时,工作量非常大。由于中国人一般只认识数千汉字,所以要由两岸四地的文字专家参照各项标准联合制定此表,工作难度很大。

    沈:如果域名注册公司只要按照IETF的标准都可以进行全球的业务推广,这是否会带来像当年NSI在中国推中文域名那种市场竞争或是对非技术人员的用户是种误导?

    钱:竞争是有的。这里的技术难度非常大。

    我们认为:将来ccTLD(注:指国家和地区顶级域名,例如.CN)较gTLD(注:指通用顶级域名,例如.COM/.NET)而言更有优势。因为ccTLD只处理一种语言文字,而gTLD要处理多种语言。多种语言规则之间可能会产生冲突,这样一来难度会加大。所以会上有很多人主张要先做ccTLD,在取得一定的经验,gTLD有了解决问题的办法后再gTLD。TWNIC(台湾地区互联网络信息中心)执行长陈文生教授在会上曾报告说,按照我们的计算方法,VeriSign公司数据库中的数据重复率已经达到了23%。这一问题已经充分引起了互联网之父、ICANN理事会主席Vint Cerf的关注。虽然注册大量的域名可以增加注册商的收入,但客户无法承受这样的压力。这样的问题在gTLD中是不可避免的,我们在ccTLD中正在努力解决这样难题,并且已经有了初步的方案。

    沈:将来是否只有本地的域名才能进行国际化,即中文域名只能和.CN 域名捆绑?

    钱:我们希望将来既可以实现中文域名.CN,也可以实现“中文域名.中国”、“中文域名.公司”等形式的域名注册。这些都是针对ccTLD(注:指国家和地区顶级域名)。由于.CN域名已经在数据库中存在,但“.中国”在现有数据库中尚没有可对应的记录,这就需要我们在下一步工作种采取措施进行解决。现阶段所处理的是中文域名.CN。两岸四地各NIC的系统是统一的。

    沈:原根服务器的树状结构是“一对一”(one to one),而在对域名进行“国际化”后将出现“数据包对数据包”(Package To Package)”的形式。这是否意味着除了可在“客户端”(下载加以)解决以外,根服务器层的解决也是一个在IETF技术标准通过后它的一种建议?

    钱:我们在每一个域名注册后都给一个不可分割的数据包(Package)。如果用户想删除某一个域名则会将整套全部删除;如果要对域名注册信息进行修改则可以做内部的调整。但作为一个整体,规定不允许对(数据)包(Package)内的某一部分进行删除。这并不是一个新生事物,我们只不过为每个域名都附加了一个数据包。域名还是一一对应,这与根服务器的结构没有关系,只是“客户端”的下载是必须的。

    沈:据了解,“通用网址”的客户端也被包括在“中文域名”的客户端中,那么CNNIC就是在推广工作中可以做到一举两得,可以这么理解吗?

    钱:是的,用户也省事。

    沈:那么,我们是建议客户同时注册“中文域名”和“通用网址”还是允许他们对二者分开注册?

    钱:可以同时注册,这样方便其他用户的查找。但这二者的形式不同,“(中文)域名”格式严谨,“通用网址”目前还不允许加"."。这是两套不同的名字(系统),但“客户端”一旦被下载,它可以自动识别用户输入的是“(中文)域名”还是“通用网址”。这只是便利用户,并非强迫用户要同时注册。

    沈:二者在应用中会不会有冲突?比如用户只注册了一种名字,一旦另一种名字在之前已被人抢注了,问题如何解决?目前好像还没有对应“通用网址”的协调条款。

   钱:没有关系,如果“通用网址”被抢注,这跟“客户端”中两个功能同时提供没有必然的关系。注册“(中文)域名”的一方可以提出争议。我们目前有“(中文)域名”的争议解决机制,也有针对“通用网址”的争议解决机制。

   沈:谢谢钱老师接受我们的采访并介绍了这么多有价值的技术前沿信息。相信它们对希望了解中国在“中文域名”和“通用网址”研究及应用感兴趣的技术、市场人员都是很重要且有用的。

   [资料]钱华林,CNNIC工作委员会副主任。

    计算机网络与数据通信专家、中科院研究员。1965年毕业于中国科技大学自动化系计算机专业,现任中国科学院计算机网络信息中心副主任、研究员、博士生导师,亚太地区顶级域名组织(APTLD)主席、亚太互联网络中心(APNIC)执行委员、中国CN域名管理和技术联系官、中文域名协调联合会(CDNC)理事长,中国互联网协会副理事长。

    钱华林自1975年起从事计算机网络与数据通信领域的研究:1980-1982年在美国佐治亚理工学院从事网络研究;1983-1984年在西德合作研制了X.25分组交换网络;1986年主持设计了第十一届亚运会电脑信息系统总体方案;1986年起,在国际上较早研制、开发了多种型号的传真/数据/语音通信系统,并作为产品销售数万套;1989年10月起主持世行贷款国家重点学科发展项目“中国国家计算与网络设施”(NCFC工程)的建设工作,于1994年4月首次实现中国与Internet的完全连接,同时担任我国与Internet的技术和行政联络员。NCFC工程项目荣获1998年“中科院科技进步特等奖”。此后又主持完成了NCFC工程的拓展工程CASNet、CSTNet等大型网络工程。历年来在国内外发表论文30多篇,培养硕士、博士研究生20余名,多次荣获国家及中科院的科技进步奖,享受国务院政府特殊津贴。

     钱老师现带有近20名研究生。

相 关 报 道
v 采访第六届IAB主席:John C. Klensin 博士 11-24
v 中国建议改革ICANN体制 提出建立独立国际性机构 11-23
(http://tech.21dnn.com/28/2002-11-26/116@539866.htm)

发表评论:

    昵称:
    密码: (游客无须输入密码)
    主页:
    标题:
  收藏此页到365Key