ruby-list

こんにちは、なかむら(う)です。

In message "[ruby-list:48712] Re: 多言語を含むUTF-8テキストから文字種を判定する方法"
    on Apr.25,2012 13:42:54, <eda@nerv.org> wrote:
> みたく、1つのString自体には1つの言語だけだという想定です。
> そもそも漢字だけで言語がすぐに判定できないということでしょうか...??

少なくとも漢字では無理です。
Unicodeでは主要な漢字は「CJK統合漢字」というジャンルにまとめ
られており、日本、韓国、繁体字、簡体字が原則区別なく押し込ま
れています。


> 元のテキストはExcelのセルからWin32OLEで経由でとってくるつもりなのですが
> そちらから情報を得る手段もないでしょうか?

Excelも特にセル単位では言語情報を保持してはいなかったと思いま
す。
ただ、書式指定でフォントを指定してるなら、それを抜くのはどう
でしょうか？


それでは。
-- 
U.Nakamura <usa@garbagecollect.jp>

Thread

Prev Next

In This Thread

Prev Next

[#48679] Poszukujemy w Twoim regionie pomocnikow do dobrze oplacanej pracy. — <nahi@...>

[#48680] Get a New Job Today — <rubikitch@...>

[#48681] Current Vacancy — <shugo@...>

[#48682] Job Offer - Flexible Hours — <shugo@...>

[#48683] klass と Marshal.load(Marshal.dump klass) が同じにならない — dezawa <dezawa@...>

[#48684] [ANN] AdLint 1.6.0 リリース — Yutaka Yanoh <ruby-list@...>

[#48689] 日時の文字列をTimeクラスに変換したい — ichirojiro@...

[#48695] 第21回Rails勉強会＠東北のお知らせ — fujioka <fuj@...>

[#48697] [ANN] Excel操縦用ライブラリexlap v1.1 release — "YOSHIIZUMI" <t-yoshiizumi@...>

[#48698] RDOCの使い方を教えてください（Windows UTF-8で日本語有り） — ichirojiro@...

[#48700] rdoc に無視されるファイル — dezawa <dezawa@...>

[#48702] Ruby187p358（mingw） WINDOWSのデバッガについて — "前川 映一" <eiichi_maekawa@...>

[#48703] 単項演算子 - に関する違和感 — 小田 利通 <oda@...>

[#48704] undefined method `+' for nil:NilClass (NoMethodError) — konoki-nannoki-ggrks.mp4@...

[#48706] — konoki-nannoki-ggrks.mp4@...

[#48707] FreemindでHTML文書を作るスクリプト — "Mt.Trail" <trail@...4you.com>

[#48710] 多言語を含むUTF-8テキストから文字種を判定する方法 — えだ ゆきひこ <eda@...>

[#48717] gtk2のマウスクリックイベントの挙動について — "Kazuki Mochizuki" <ktrnn806@...>

[#48720] [解決]gtk2のマウスクリックイベントの挙動について — "Kazuki Mochizuki" <ktrnn806@...>

[#48722] [ANN] AdLint 1.8.0 リリース — Yutaka Yanoh <ruby-list@...>

[#48723] NMatrix による除算 — "KISHIMOTO, Makoto" <ksmakoto@...4u.or.jp>

[ruby-list:48713] Re: 多言語を含むUTF-8テキストから文字種を判定する方法

Thread

In This Thread

[#48702] Ruby187p358（mingw） WINDOWSのデバッガについて — "前川映一" <eiichi_maekawa@...>

[#48703] 単項演算子 - に関する違和感 — 小田利通 <oda@...>

[#48710] 多言語を含むUTF-8テキストから文字種を判定する方法 — えだゆきひこ <eda@...>