《30天自制操作系统》最近一直再看,最近已经看到后面了,看到第28天,里面讲到可以实现对全角字符的支持,而原操作系统代码里面只是支持了日语显示,而中文版的这本书也只是讲了一个思路,具体的实现也是没有的。网上也好像没有人实现过这个吧,我是找不到。(由于书中每一章每一小节都有代码,我看书的时候就懒得去实际写代码,就简单看看。不过这次就可以写一下了,加深对这个系统的了解)反正没事做,就准备实现对这个系统的汉字全角支持。

一、了解HZK编码
  在改造之前,我们先了解一下符合GB2312标准的中文点阵字库文件的HZK16。百度搜索HZK16第一个那个百度百科连接就是了。
  HZK16字库是符合GB2312标准的16×16点阵字库,HZK16的GB2312-80支持的汉字有6763个,符号682个。其中一级汉字有3755个,按声序排列,二级汉字有3008个,按偏旁部首排列。我们在一些应用场合根本用不到这么多汉字字模,所以在应用时就可以只提取部分字体作为己用。
  HZK16字库里的16×16汉字一共需要256个点来显示,也就是说需要32个字节才能达到显示一个普通汉字的目的。
  我们知道一个GB2312汉字是由两个字节编码的,范围为A1A1~FEFE。A1-A9为符号区,B0到F7为汉字区。每一个区有94个字符(注意:这只是编码的许可范围,不一定都有字型对应,比如符号区就有很多编码空白区域)。下面以汉字“我”为例,介绍如何在HZK16文件中找到它对应的32个字节的字模数据。
  前面说到一个汉字占两个字节,这两个中前一个字节为该汉字的区号,后一个字节为该字的位号。其中,每个区记录94个汉字,位号为该字在该区中的位置。
  区码和区号,其实是一个东西
  区码:区号(汉字的第一个字节)- 0xa0 (因为汉字编码是从0xa0区开始的,所以文件最前面就是从0xa0区开始,要算出相对区码)
  位码:位号(汉字的第二个字节)- 0xa0
  这样我们就可以得到汉字在HZK16中的绝对偏移位置:
    offset=(94*(区码-1)+(位码-1))*32
  注解: 1、区码减1是因为数组是以0为开始而区号位号是以1为开始的
      2、(94*(区号-1)+位号-1)是一个汉字字模占用的字节数
      3、最后乘以32是因为汉字库文应从该位置起的32字节信息记录该字的字模信息(前面提到一个汉字要有32个字节显示)

二、添加代码
  首先查看一下c语言里面的中文编码是否真的跟书上讲的是否一样。我们先修改iroha/iroha.c这个文件,代码如下

 1 #include "apilib.h"
 2 #include <stdio.h>
 3 
 4 void HariMain(void)
 5 {
 6     static char s[9] = { 0xb2, 0xdb, 0xca, 0xc6, 0xce, 0xcd, 0xc4, 0x0a, 0x00 };
 7     char ch[10];
 8     char str[100]="我 啊\n";
 9 int i,j;    
10     api_putstr0(s);
11     sprintf(ch,"%x %x %x %x\n",s[0],s[1],s[2],s[3]);
12     api_putstr0(ch);
13     sprintf(ch,"%x %x %x %x %x %x\n",str[0],str[1],str[2],str[3],str[4],str[5],str[6],str[7]);
14     api_putstr0(ch);
15     api_putstr0(str);
16     api_putstr0("4");
17 
18     api_end();
19 }
View Code

相关文章: