【问题标题】:looking for a UTF-8 text editor寻找 UTF-8 文本编辑器
【发布时间】:2010-09-18 00:59:22
【问题描述】:

我正在寻找一个(简单的)文本编辑器,它可以处理同一文档中不同编码的文本。

我需要开发一些日文和英文混合文本的网站,而我现在拥有的编辑器(在英文 Windows 系统上)无法显示日文文本。 Jedit 文件不显示我输入的日语文本,但是当我在浏览器中查看该文件时,它会正确显示。 Gvim 将编辑器中的所有日文文本显示为问号,也在浏览器中显示。 在 Gvim 中输入汉字作品(输入发音,然后按空格键来获取汉字)但是当你确认你想要的汉字时,它会用问号替换那个汉字。 (每个汉字一个问号)。

有人可以推荐我一个文本编辑器来编辑能够显示 utf-8 编码文本并保存为 utf-8 文件的 html 和 php 文件吗?

谢谢。

在阅读了有关 emacs 的信息后,我安装了它。见下文。

感谢大家的提示。 如果您还没有 unicode 字体,则必须在网上找到一种或购买一种。 这是在 Windows 系统上安装字体的说明http://support.microsoft.com/kb/314960

j编辑 我将 Jedit 中的字体更改为 UTF 字体,现在日文显示正常。 输入日语仍然有问题,因为您看不到您在输入什么。 (要更改字体以编辑文件,请转到实用程序 -> 全局选项 -> 文本区域 选择一种 Unicode 字体,您将能够看到日文字符。

gVim 我仍在尝试弄清楚如何在 gvim 中添加字体。一旦我知道该怎么做,我会更新这个。

Emacs Emacs 无法正确显示汉字,它们显示为 ???但至少我可以看到我输入的日语并选择正确的单词。

所以在这一点上我不得不说,在 jEdit 中我可以看到日文文本,但我无法输入日文文本。 Gvim 我可以输入日文文本,但在文本区域内显示为 ??? Emacs 也是如此。 遗憾的是,在 emacs 和 gvim 中添加字体并非易事。 目前,我使用带有 Arial unicode MS 字体的记事本,并将其保存为 UTF-8 文件作为我的日语编辑器。不理想,但至少它有效。

【问题讨论】:

  • 这是一个可怕的要求:“同一文档中的不同编码”。如果有人创建了这样的格式,他应该被解雇。去 Unicode,忘记那些废话。此外,如果(由于某种原因)您不能使用 Unicode,所有日语代码页都毫无问题地支持英语 + 日语。
  • something 那个叫“Unicode 源代码和文本编辑器”怎么样?它的功能非常齐全.. 为简单起见,Notepad++ 是野兽..
  • @MihaiNita 这也是我在阅读第一句话时的反应,但幸运的是“同一文档中的不同编码”,OP 似乎仅表示“同一文档中的日文和英文文本”( Unicode,以 UTF-8 编码)。事后看来,OP 的问题似乎只是没有显示日文字符的良好系统字体,现在可能已经修复了。

标签: unicode utf-8 character-encoding text-editor


【解决方案1】:

强烈推荐记事本++。

【讨论】:

  • 是的,但是,notepad++ 似乎不支持 ANSI 编码的日文字符。此外,它有时会“忘记”该文档是 utf8(无 bom)实际上是一个 utf 文档。因此,如果在将编码设置回 utf8 之前按保存,您的日文字符将被丢弃。帮助这很快得到改善。
  • Notepad++ 做了一些奇怪的事情。有时它只是在更改显示代码页时更改文件的长度。有时只更改显示代码页时会要求保存,这不应该更改文件内容。
【解决方案2】:

Emacs 为我正确处理 UTF-8。 (当然,它可以编辑 HTML 和 PHP 文件)。

【讨论】:

    【解决方案3】:

    我仍然会推荐 Vim。您看到的问号问题可能是您使用的字体的问题。当显示包含当前语言中没有的字符的文本时,应用程序通常将它们显示为空框或问号。请参阅此处以获取 Vim 中的 UTF-8 支持。

    Vim 手册的This section 也很有帮助,尤其是对于在 Windows 中设置 UTF-8。

    【讨论】:

    • 在 Windows 上,如果出现问号,则表示字符编码已损坏 - 例如,您试图将 UTF-8 显示为常规 ANSI - 如果字体有问题,您将获取盒子
    • ����� osdir.com/ml/linux.debian.packages.vim.devel/2006-11/…。它们在我的系统上显示为问号。在上下文中查看它(看起来很随机),它们似乎是我的系统无法显示的字符
    • 我很确定这意味着它们已经在某个地方被破坏了——考虑到源可能是博客软件或新闻组刮板。见这里:blogs.msdn.com/michkap/archive/2008/10/13/8997133.aspx - “轮子”符号显示为一个框(对我来说)
    • 嗯。你可能是对的,如果你找到一个来源把它放在这里,不过。我会把它作为一个问题发布,但我不确定它的编程是否足够相关......
    【解决方案4】:

    大多数支持 Unicode 的文本编辑器都存在一个问题:当您选择一种字体时,它们会坚持使用它。如果字体不包含字符的字形,则使用默认替换字符(我相信 U+FFFD,REPLACEMENT CHARACTER)。

    相比之下,网络浏览器通常会尝试在系统提供的所有字体中为它们必须显示的字符找到一个字形。

    因此,如果您没有“Arial Unicode MS”字体或类似字体(包括日文字形),您需要的是一个尝试将字形与所选字体以外的其他字体匹配的编辑器。

    在有人为这样的编辑器提供链接之前,我会建议一个(有点极端的:)编辑器:

    • 安装最新稳定的python 2.x版本for MS Windows(目前为2.6)。
    • 在安装中包含“idle”。
    • 开始 → 程序 → Python 2,6 → 空闲 (Python Gui)

    “空闲”编辑器通常用于编辑 Python 代码(并在 Python shell 中以交互方式对其进行测试)。但是,它可以用作纯 Unicode 感知的文本编辑器,当保存包含非 ASCII 字符的文本时,它默认为 UTF-8 编码。

    现在idle是基于tkinter的,tkinter是tk的接口,tk是tcl的gui库; tcl/tk 与网络浏览器一样,当被要求显示小部件字体中不存在字形的字符时,它也会搜索其他字体。

    无论这看起来多么牵强,我真的相信它会有所帮助;如果没有其他解决方案可以帮助您,请尝试一下。

    【讨论】:

      【解决方案5】:

      Vim 适合我作为 UTF-8 文本编辑器。

      首先,您需要一种包含您正在使用的字符的字体。选择另一个文本编辑器对您没有帮助(除非当您使用的字体没有其他字体时,它会搜索其他字体以获取正确的字符)。如果你使用 gVim,你可以设置如下字体:

      set guifont=Consolas
      

      (这并不是说 Consolas 是您想要的字体。)您可能希望将其放在 .vimrc 文件中以便始终使用它。

      其次,Vim 需要将文件解释为 UTF-8,但它并不总是自动这样做。为此,请执行以下操作:

      set encoding=utf8
      

      您还可以查看它使用的编码:

      set encoding?
      

      【讨论】:

        【解决方案6】:

        EmEditor 正是由一家日本公司为此目的而编写的。它是一款出色的文本编辑器,具有良好的性能/简单性,但几乎具备强大编辑器所期望的所有功能;我在 Windows 平台上使用它作为我的默认设置,以及编辑日语网页模板。它值得成为更知名的 IMO;它至少和 TextPad 一样好,但完全支持 Unicode。

        很遗憾,它不是免费的,但是您可以在 download.com 等网站上找到旧版 EmEditor 6 的免费版本。

        【讨论】:

          【解决方案7】:

          您可以只使用带有“Arial Unicode MS”字体的 Notepad.exe(如果您的所有文本都是从左到右的,给定英文 Windows 版本)。只需另存为,选择 UTF-8。

          一般来说,使用您最喜欢的编辑器和“Arial Unicode MS”之类的字体。我提到这个是因为它是我见过的 Unicode 覆盖率最高的字体,

          【讨论】:

            【解决方案8】:

            试试BabelPad。编辑方面,很简单。支持 Unicode,太棒了!

            【讨论】:

              【解决方案9】:

              听起来 Jedit 的问题可能在于字体 - 您使用的字体是否可以正确显示所有字符?

              更准确地说,Arial Unicode MS 是一种 Unicode 字体的合理选择,它可以显示各种语言范围内的各种字符。它存在某些问题,可能使其对于某些单独使用的语言不是最佳选择 - 这就是为什么 Windows 中还包含特定于语言的 Unicode 字体。

              【讨论】:

                【解决方案10】:

                只要我使用真正包含我想要的字符的字体,我就从来没有遇到过 vim 的问题。它必须是等宽字体。 :set enc=utf8 进入 utf8 模式。然后您可以使用 :digraph 命令来显示可用字符,并查看每个字符的显示方式。

                要添加字体,请在 Windows 中添加(控制面板/字体/添加字体)。如果是等宽字体,则会在 /Edit/Font 中以 vin 显示。

                【讨论】:

                  【解决方案11】:

                  只是添加另一个:我刚刚检查了 Programmer's Notepad 2 也有一些 UTF-8 设置。

                  (vim 和 emacs 也可以)

                  【讨论】:

                    【解决方案12】:

                    EditPlus 似乎是UTF-8 的更好选择,因为我已经使用了它。

                    【讨论】:

                    • +1 EditPlus 是我的同事一直推荐的东西。具有将编码更改为 UTF-8 的简单选项。
                    【解决方案13】:

                    EditPad Lite and Pro 从版本 6 开始完全支持 Unicode。(免责声明:这些是我自己的产品。)

                    如果出现问号,则表示您使用的编码不支持日文字符。在 EditPad 中,您可以通过 Convert、Text Encoding 更改文本编码(Unicode、遗留代码页)。您可以在选项、配置文件类型、编码中设置每种文件类型的默认值。

                    如果您看到的是正方形而不是日文字符,请选择日文字体或 Unicode 字体。您可以通过选项、字体在 EditPad 中执行此操作。

                    要输入日语,只需在 Windows 控制面板的键盘设置中安装日语键盘驱动程序即可。

                    EditPad Pro 为 PHP 和 HTML 预先配置了文件类型。

                    【讨论】:

                      【解决方案14】:

                      凯特。通过扩展,任何其他使用 Kate 作为嵌入式 KPart 的 KDE 程序(KWrite、Quanta+、KDevelop)。它处理很多编码,但我喜欢总是使用 UTF-8。它还有大量的语法高亮。

                      【讨论】:

                        【解决方案15】:

                        试试 SciTE http://gisdeveloper.tripod.com/scite.html。太棒了;)

                        【讨论】:

                          【解决方案16】:

                          对于非常基本的 UTF-8 多语言文本编辑,我对 BabelPad (www.babelstone.co.uk) 很满意:它免费、简单且功能强大,几乎可以毫不费力地显示所有内容。当编辑需要更严格时,我会使用 EditPad Pro,或者偶尔使用 Notepad++。对于 Windows 上的非 Unicode 编辑,我是 TextPad 用户——我的员工和我可能在 TextPad 上花费了大约 200,000 小时,只是偶尔尝试使用 NotePad2、MadEdit、jEdit、XML Copy Editor 和 EPCedit。后两者可以很好地处理 UTF-8 XML 文件。上面提到的所有编辑器都是免费的,除了 TextPad 和 EditPad Pro。感谢推荐Emeditor的人。我会尝试一下。 --PFSchaffner

                          【讨论】:

                            【解决方案17】:

                            我喜欢jEdit,因为它能够识别换行。编辑 XML 文件时非常好。不过要提醒一句:它是 Java,所以它不像你期望的文本编辑器那样快速。

                            完全支持文本编解码器。它区分带有和不带有标识文件格式 (byte order mark) 的标头的文本文件,将它们称为 UTF-8 和 UTF-8Y。这是我在其他文本编辑器中所缺少的。

                            【讨论】:

                              【解决方案18】:

                              试试 EditPlus。它具有对 HTML、语法高亮的特定支持,也可以作为任何编译器的简单 IDE。

                              【讨论】:

                                【解决方案19】:

                                在 Mac 上:SubEthaEdit 对字符编码具有出色的支持。

                                【讨论】:

                                  【解决方案20】:

                                  TextPad 也是一个很好的实用程序。这是一个试用软件,但工作正常。看看如何设置char-encoding-setting-in-textpad

                                  【讨论】:

                                    【解决方案21】:

                                    对于日本人来说,Sakura Editor 是个例外。可以显示UTF-8、EUC-JP、SJIS等。

                                    【讨论】:

                                      【解决方案22】:

                                      http://www.ultraedit.com/ 是一个多平台编辑器,可以进行 UTF-8 和各种格式之间的转换

                                      【讨论】:

                                        【解决方案23】:

                                        EditPad Pro ...推荐给你

                                        干杯 ;)

                                        【讨论】:

                                          猜你喜欢
                                          • 2023-04-02
                                          • 1970-01-01
                                          • 1970-01-01
                                          • 2016-05-10
                                          • 2012-05-10
                                          • 1970-01-01
                                          • 2011-07-10
                                          • 1970-01-01
                                          • 2023-03-21
                                          相关资源
                                          最近更新 更多