[#40528] [Feature #2833] 絵文字エンコーディングの提案 — Kenta Murata <redmine@...>
Feature #2833: 絵文字エンコーディングの提案
まつもと ゆきひろです
=1B$B$`$i$?$G$9!#=1B(B
GyRCOjQhOUxaJEg/PSQ3JF4kOSEjGyhCCgpSYWlscxskQiROGyhCanBtb2JpbGUbJEIkSCQkJCYl
チケット #2833 が更新されました。 (by Yui NARUSE)
=1B$B$`$i$?$G$9!#=1B(B
遠藤です。
遠藤です。
> Feature #2833: 絵文字エンコーディングの提案
[#40573] [bug:1.8] ossl_ssl_session.c:110: warning: implicit declaration of function 'TIMET2NUM' — Tanaka Akira <akr@...>
Ruby 1.8 で、以下の警告が増えています。
2010/3/7 Tanaka Akira <akr@fsij.org>:
[#40597] Re: [ruby-list:46898] 重複組合せは組込みにならないのでしょうか? — "KISHIMOTO, Makoto" <ksmakoto@...4u.or.jp>
きしもとです
まつもと ゆきひろです
遠藤です。
> 同様に、repeated_permutation/combination のデフォルト引数にも反対
まつもと ゆきひろです
[#40614] [Bug #2956] segfault — Tomoki MAEDA <redmine@...>
Bug #2956: segfault
[#40623] Enumerable#interleave — Yukihiro Matsumoto <matz@...>
まつもと ゆきひろです
2010年3月13日22:44 Yukihiro Matsumoto <matz@ruby-lang.org>:
まつもと ゆきひろです
2010年3月14日0:04 Yukihiro Matsumoto <matz@ruby-lang.org>:
まつもと ゆきひろです
[#40641] [Bug #2965] method `===' called on hidden T_STRING object (NotImplementedError) — Kenta Murata <redmine@...>
Bug #2965: method `===' called on hidden T_STRING object (NotImplementedError)
チケット #2965 が更新されました。 (by Shyouhei Urabe)
[#40643] draft of 1.9.2 release schedule — Yusuke ENDOH <mame@...>
Yugui さん、
[#40649] [Feature #2968] 数値の正負を返すメソッド — Yui NARUSE <redmine@...>
Feature #2968: 数値の正負を返すメソッド
チケット #2968 が更新されました。 (by Yui NARUSE)
> チケット #2968 が更新されました。 (by Yui NARUSE)
成瀬です。
> 成瀬です。
[#40650] [Feature #2969] String#to_f が -h.hhh±pd を解釈できるように — Yui NARUSE <redmine@...>
Feature #2969: String#to_f が -h.hhh±pd を解釈できるように
質問ですが、この形式は入力だけでなく、なんらかの方法で出力でも利用でき
成瀬です。
> String#to_f は従来から指数表記を許していたので、
成瀬です。
> to_i がデフォルトで prefix を見ないのは、0377 のような、
成瀬です。
> 先のパッチの対象関数が ruby_strtod である通り、
成瀬です。
> strtod(3) の解釈対象に含まれていない 2 進や 8 進を否定することが、
(2010/03/26 3:05), Tadayoshi Funaba wrote:
> なぜ同じなのでしょう。
(2010/03/26 4:02), Tadayoshi Funaba wrote:
>> strtod(3) を参考にしたり、影響されたりすることは普通にあるとは思います
(2010/03/27 18:19), KOSAKI Motohiro wrote:
えぐち@エスアンドイーです
(2010/03/27 20:26), EGUCHI Osamu wrote:
> つまり、ふなばさんは 16 進よりも 2 進や 8 進形式が好みであるところ、
まつもと ゆきひろです
[#40672] URI methods for application/x-www-form-urlencoded — Tanaka Akira <akr@...>
最近、成瀬さんが追加した URI.encode_www_form など、
[#40695] keiju, please check tickets assigned to you — Yusuke ENDOH <mame@...>
いしつかさん
けいじゅ@いしつかです.
いしつかさん
けいじゅ@いしつかです.
遠藤です。
[#40735] [Bug #2995] TestHash#test_recursive_check fails — Shugo Maeda <redmine@...>
Bug #2995: TestHash#test_recursive_check fails
[#40746] [Bug #1031] -U オプションの説明が --help にない — Yusuke Endoh <redmine@...>
チケット #1031 が更新されました。 (by Yusuke Endoh)
前田です。
[#40779] [Feature #3018] UNINITIALIZED_VAR() マクロの導入 — Motohiro KOSAKI <redmine@...>
Feature #3018: UNINITIALIZED_VAR() マクロの導入
まつもと ゆきひろです
> |Linuxではこの問題にたいして以下のようなマクロで解決しており、同様の手法を導入したいと
まつもと ゆきひろです
本題じゃないですが、
[#40805] Improvement of Fiber switching cost with system dependent way — SASADA Koichi <ko1@...>
ささだです.
こんにちは、なかむら(う)です。
[#40832] Process.daemon() returns -1 on failure ifndef HAVE_DAEMON — "Akinori MUSHA" <knu@...>
Process.daemon() 失敗時の挙動が、 HAVE_DAEMON 定義時と非定義時
2010年3月29日19:52 Akinori MUSHA <knu@idaemons.org>:
> 2010年3月29日19:52 Akinori MUSHA <knu@idaemons.org>:
[#40833] [Bug: trunk] Fiber transfer limitation — SASADA Koichi <ko1@...>
ささだです.
[#40855] revert 1.9 \w limitation to ASCII — Yukihiro Matsumoto <matz@...>
まつもと ゆきひろです
[#40884] [Feature #3065] [TypedData] という名前について — Tadashi Saito <redmine@...>
Feature #3065: [TypedData] という名前について
[ruby-dev:40541] Re: [Feature #2833] 絵文字エンコーディングの提案
> むらたです。 > > On 2010/03/03, at 8:48, KOSAKI Motohiro wrote: > > >> - Shift_JIS-DoCoMo > >> - Shift_JIS-KDDI > >> - ISO-2022-JP-KDDI > >> - Shift_JIS-SoftBank > > > > この4つは直感的に理解出来るとして > > > >> - UTF8-Google > > > > これは普通のUTF-8とは違うもの? > > 違います。UTF8-Google は、DoCoMo, KDDI, SoftBank のそれぞれの > 絵文字集合の和集合を持っており、現存する3者が持つすべての絵文字に > 一意なコードポイントを割り当てています。以下の URL が対応表です。 > > http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html > > この表の最初の行を見ると分かるように、UTF-8 と UTF8-Google では > 「晴れ」を表す絵文字の扱いが異なります。 > DoCoMo, KDDI, SoftBank 各社の「晴れ」絵文字を UTF-8 へ変換すると > U+2600 に変換されるため、元々絵文字であった事実が失われます。 > UTF8-Google へ変換すると U+FE000 へ変換され絵文字である事実は > 失われません。 変換表の収録は、一定以上の規模のユーザがいるメジャーなものに限るべきと 思っています。 その観点からすると、ちょっとパンチが弱い主張に思えます。 正直Unicodeに絵文字が収録された後で、UTF-8-Googleを使い続ける人が 多数でる気もしません。 # だって、絵文字を使うのは日本人だけで、日本のPCのIMEで晴れのマークとか # 普通には入力できないですよね これを1.9.2では落として、将来課題、今後世間の動向を見ながら決めていく。 とした場合、どのようなデメリットがありますか? > > >> - UTF8-DoCoMo > >> - UTF8-KDDI > >> - UTF8-SoftBank > > > > この3つは、utf-8-macのように、utf-8に変換ルールヒントを加えたもの > > という理解でいいのでしょうか? > > 各 transcoder で絵文字のコードポイントに対して適切な変換結果を対応させています。 > > > 3社でPUAの使い方が違う?? > > PUA が Private User Area の略だということは教えてもらったのですが、 > 「PUA の使い方」という言葉がよく分かっていません。 > 複数の使い方があるんでしょうか? むらたさんは僕の質問にすでに答えていて、 http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html で一目瞭然なように3社が各自にPUA(私用領域)の別々の場所にコードポイントを 割り当てている。 かつ、S!アプリ 等の携帯内部でのUnicodeはキャリアが定めたコードポイントを 使わないといけないので、それぞれ別の変換表が必要。ということですね。 これはOKだと思います。ただ、携帯の内部表現については普段あまり意識していないと 思うのでるりまの説明の方に、もう一言捕捉があるとうれしいかもしれません。 > >> - stateless-ISO-2022-JP-KDDI > > > > stateless iso-2022というのが、どういう状況で使うのか想像できないので > > 解説をお願いしていいですか? > > これは内部で使われているだけなので、表に名前を出す必要はなかったですね。 > > 現状では ISO-2022-JP <-> EUC-JP の変換が stateless-ISO-2022-JP を介した > 変換で実現されています。stateless-ISO-2022-JP-KDDI は、 > ISO-2022-JP-KDDI <-> UTF8-KDDI の変換でこれを真似したために存在しています。 うん。可能であれば、ユーザ非公開にしていただきたいです。 文字コードの問題って一番多いのが、無駄に分かりにくい事が原因による使用法誤解だと 思うので。 > > > 第一印象としては、現実の汚さを反映してそれなりに使い方がやっかいなシロモノ > > になっているので、どこかにガイドアーティクルがあるとうれしいんじゃないかと > > 思いました。 > > なるほど、私もそう思います。達人出版会の出番ですね! > > > # それを言ったら日本語コード変換は全般的に罠の宝庫なので「日本語コード変換HOWTO」 > > # が必要だ。という気も若干してきますが、発散するので気づかなかったことに > > 私はなにも見ていません。 > > > とりあえず、Encodingクラスのリファレンスに加筆する予定の、エンコーディングの > > 説明を見せて頂けると、レビューしやすいです。 > > きっと、コード本体については誰も反対しないんだろうし。 > > るりまの以下のページにある定数表のことですよね? > http://doc.okkez.net/192/view/class/Encoding はい。 > > こんな感じかなぁ > > --- Encoding::UTF8_DoCoMo > DoCoMo 携帯の絵文字を含む UTF-8 エンコーディングです。 > 絵文字のコード表は以下で公開されています。 > [[url:http://www.nttdocomo.co.jp/service/imode/make/content/pictograph/basic/]] > [[url:http://www.nttdocomo.co.jp/service/imode/make/content/pictograph/extention/index.html]] > > --- Encoding::UTF8_KDDI > KDDI 携帯の絵文字を含む UTF-8 エンコーディングです。 > Web のフォームに入力された絵文字のコードにも対応しています。 > 絵文字のコード表は以下で公開されています。 > [[url:http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf]] > > --- Encoding::UTF8_SoftBank > SoftBank 携帯の絵文字を含む UTF-8 エンコーディングです。 > 絵文字のコード表は以下で公開されています (2つ目はユーザ登録が必要)。 > [[url:http://creation.mb.softbank.jp/web/web_pic_about.html]] > [[url:http://www2.developers.softbankmobile.co.jp/dp/tool_dl/download.php?docid=120&companyid=]] > > --- Encoding::UTF8_Google > DoCoMo, KDDI, SoftBank 各社の絵文字集合の和集合に含まれる各文字に対して一意なコードポイントを与えた UTF-8 亜種です。 > 各社の絵文字と Google のコードポイントとの対応関係は emoji4unicode プロジェクトの成果に基づいています。 > [[url:http://code.google.com/p/emoji4unicode/]] > > --- Encoding::SJIS_DoCoMo > DoCoMo 携帯の絵文字を含む Windows-31J の亜種です。 > 絵文字のコード表は以下で公開されています。 > [[url:http://www.nttdocomo.co.jp/service/imode/make/content/pictograph/basic/]] > [[url:http://www.nttdocomo.co.jp/service/imode/make/content/pictograph/extention/index.html]] > > --- Encoding::SJIS_KDDI > KDDI 携帯の絵文字を含む Windows-31J の亜種です。 > 絵文字のコード表は以下で公開されています。 > [[url:http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf]] > > --- Encoding::SJIS_SoftBank > SoftBank 携帯の絵文字を含む Windows-31J の亜種です。 > 絵文字のコード表は以下で公開されています (2つ目はユーザ登録が必要)。 > [[url:http://creation.mb.softbank.jp/web/web_pic_about.html]] > [[url:http://www2.developers.softbankmobile.co.jp/dp/tool_dl/download.php?docid=120&companyid=]] > > --- Encoding::ISO_2022_JP_KDDI > KDDI 携帯の絵文字を含む ISO-2022-JP の亜種です。 > 絵文字のコード表は以下で公開されています。 > [[url:http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf]] たぶん、それぞれ一言「主にxxで使われています」と書くのがよいと思います。 基本路線はこれでよいと思います。 また、もし現実にはほぼ使われていない物があれば今回は落として欲しいです。 僕が携帯の世界に疎いので若干気にしすぎな面もあるかとは思いますが、世間の Webデザイナーの認識なんてそんなもんですよ。と強引に自己正当化。