[#29190] AIXでのコンパイル (オプションの統一など) — "Yutaka Kanemoto" <kinpoco@...>
金本ともうします。
21 messages
2006/08/06
[#29247] Re: AIXでのコンパイル (オプションの統一など)
— nobu@...
2006/08/09
なかだです。
[#29194] Re: AIXでのコンパイル (オプションの統一など)
— "Yutaka Kanemoto" <kinpoco@...>
2006/08/07
大変失礼いたしました。
[#29205] Re: AIXでのコンパイル (オプションの統一など)
— "U.Nakamura" <usa@...>
2006/08/07
こんにちは、なかむら(う)です。
[#29200] Re: [ruby-cvs:17336] ruby/lib/date: * lib/date/format.rb: specify maximum number of digits to parse — Tadayoshi Funaba <tadf@...>
ふなばです。
9 messages
2006/08/07
[#29202] Re: [ruby-cvs:17336] ruby/lib/date: * lib/date/format.rb: specify maximum number of digits to parse
— Yukihiro Matsumoto <matz@...>
2006/08/07
まつもと ゆきひろです
[#29203] Re: [ruby-cvs:17336] ruby/lib/date: * lib/date/format.rb: specify maximum number of digits to parse
— Tadayoshi Funaba <tadf@...>
2006/08/07
ふなばです。
[#29204] Re: [ruby-cvs:17336] ruby/lib/date: * lib/date/format.rb: specify maximum number of digits to parse
— Yukihiro Matsumoto <matz@...>
2006/08/07
まつもと ゆきひろです
[#29209] Re: [ruby-cvs:17336] ruby/lib/date: * lib/date/format.rb: specify maximum number of digits to parse
— Tadayoshi Funaba <tadf@...>
2006/08/07
ふなばです。
[#29210] Re: [ruby-cvs:17336] ruby/lib/date: * lib/date/format.rb: specify maximum number of digits to parse
— Yukihiro Matsumoto <matz@...>
2006/08/07
まつもと ゆきひろです
[#29246] Enumerable#each_* and Enumerable#enum_* on 1.9 — "U.Nakamura" <usa@...>
こんにちは、なかむら(う)です。
8 messages
2006/08/09
[#29685] Re: Enumerable#each_* and Enumerable#enum_* on 1.9
— Yukihiro Matsumoto <matz@...>
2006/10/22
まつもと ゆきひろです
[#29687] Re: Enumerable#each_* and Enumerable#enum_* on 1.9
— "Nobuyoshi Nakada" <nobu@...>
2006/10/23
なかだです。
[#29252] 1.8.5への最終コミット — Yukihiro Matsumoto <matz@...>
まつもと ゆきひろです
14 messages
2006/08/10
[#29258] Re: 1.8.5への最終コミット
— nobu@...
2006/08/11
なかだです。
[#29259] Re: 1.8.5への最終コミット
— "U.Nakamura" <usa@...>
2006/08/11
こんにちは、なかむら(う)です。
[#29268] Re: 1.8.5への最終コミット
— Yukihiro Matsumoto <matz@...>
2006/08/15
まつもと ゆきひろです
[#29271] Re: 1.8.5への最終コミット
— URABE Shyouhei <root@...>
2006/08/15
卜部です。
[#29253] Bus Error on OS X with rjb, irb and dl — arton <artonx@...>
artonです。
10 messages
2006/08/10
[#29257] Re: Bus Error on OS X with rjb, irb and dl
— kimura wataru <kimuraw@...>
2006/08/11
木村といいます。
[#29260] Re: Bus Error on OS X with rjb, irb and dl
— arton <artonx@...>
2006/08/11
artonです。
[#29284] CGI#out で MIMEエンコード文字列がデコードされる — とみたまさひろ <tommy@...>
とみたです。
26 messages
2006/08/17
[#29285] Re: CGI#out で MIMEエンコード文字列がデコードされる
— Takahiro Kambe <taca@...>
2006/08/17
In message <20060817182312.adce9ff7.tommy@tmtm.org>
[#29286] Re: CGI#out で MIMEエンコード文字列がデコードされる
— とみたまさひろ <tommy@...>
2006/08/17
とみたです。
[#29287] Re: CGI#out で MIMEエンコード文字列がデコードされる
— Fujioka <fuj@...>
2006/08/17
藤岡です。
[#29288] Re: CGI#out で MIMEエンコード文字列がデコードされる
— Fujioka <fuj@...>
2006/08/17
藤岡です。
[#29290] Re: CGI#out で MIMEエンコード文字列がデコードされる
— Yukihiro Matsumoto <matz@...>
2006/08/17
まつもと ゆきひろです
[#29292] Re: CGI#out で MIMEエンコード文字列がデコードされる
— Fujioka <fuj@...>
2006/08/17
藤岡です。
[#29294] Re: CGI#out で MIMEエンコード文字列がデコードされる
— とみたまさひろ <tommy@...>
2006/08/18
とみたです。
[#29399] Re: CGI#out で MIMEエンコード文字列がデコードされる
— URABE Shyouhei <root@...>
2006/09/01
卜部です。どこに繋げるか迷いましたがとりあえずここへ。
[#29291] ruby 1.8.5 preview4 — Yukihiro Matsumoto <matz@...>
まつもと ゆきひろです
21 messages
2006/08/17
[#29314] Re: ruby 1.8.5 preview4
— URABE Shyouhei <root@...>
2006/08/18
卜部です。
[#29319] Re: ruby 1.8.5 preview4
— Yukihiro Matsumoto <matz@...>
2006/08/19
[#29321] Re: ruby 1.8.5 preview4
— URABE Shyouhei <root@...>
2006/08/19
卜部です。
[#29322] Re: ruby 1.8.5 preview4
— Yukihiro Matsumoto <matz@...>
2006/08/19
まつもと ゆきひろです
[#29299] Ruby 1.8.5 + Railsでwarning — Masayoshi Takahashi <takahashi@...>
高橋征義です。
9 messages
2006/08/18
[#29304] Re: Ruby 1.8.5 + Railsでwarning
— "U.Nakamura" <usa@...>
2006/08/18
こんにちは、なかむら(う)です。
[#29316] 1.9 net/smtp.rb — WATANABE Tetsuya <Tetsuya.WATANABE@...>
渡辺哲也です。
5 messages
2006/08/19
[#29358] NetBSD で 1.8.5 を作ると site_ruby を見てくれない — "GOTO Kentaro" <gotoken@...>
いちおう報告。NetBSD で ruby-1.8.5.tar.gz からビルドすると、
4 messages
2006/08/29
[ruby-dev:29307] Re: CGI#out で MIMEエンコード文字列がデコードされる
From:
"NARUSE, Yui" <naruse@...>
Date:
2006-08-18 04:50:51 UTC
List:
ruby-dev #29307
成瀬です。
CGI#out で NKF を使うか使わないかについては特に意見はありません。
とみたまさひろ wrote:
> とみたです。
>
> On Fri, 18 Aug 2006 10:38:00 +0900
> とみたまさひろ <tommy@tmtm.org> wrote:
>
>> やっぱり、UTF-8 の時に NKF 使うのはやめませんか? なんか他にもまだ想定
>> していない問題がありそうで…。
>
> こんな問題が出ました。ソースも charset も UTF-8 なのに、コードが妙に変
> 換されてしまっています。
>
> Ruby 1.8.4
>
> $ echo | ruby -rcgi -e 'CGI.new.out("charset"=>"utf-8"){"\xef\xbc\x8d\xef\xbd\x9e\xef\xbf\xa0\n"}' | tail -1 | od -tx1
> 0000000 ef bc 8d ef bd 9e ef bf a0 0a
> 0000012
>
> Ruby 1.8.5 Preview 4
>
> $ echo | /usr/local/bin/ruby -rcgi -e 'CGI.new.out("charset"=>"utf-8"){"\xef\xbc\x8d\xef\xbd\x9e\xef\xbf\xa0\n"}' | tail -1 | od -tx1
> 0000000 e2 88 92 e3 80 9c c2 a2 0a
> 0000011
>
> ということで、NKF 使うのやめましょう。
>
> --- ruby-1.8.5/lib/cgi.rb.orig 2006-08-18 01:25:13.000000000 +0900
> +++ ruby-1.8.5/lib/cgi.rb 2006-08-18 11:33:04.000000000 +0900
> @@ -716,8 +716,6 @@
> when /shift_jis/ni
> content = NKF::nkf('-s -m0', content)
> options["language"] = "ja" unless options.has_key?("language")
> - when /utf-8/ni
> - content = NKF::nkf('-w -m0', content)
> end
> end
けれど、すでに --no-best-fit-chars とヒントは出ているのですから、
その辺は試して欲しいものです。
--no-best-fit-chars
Unicode からの変換の際に、往復安全性が確保さ
れ ない文字の変換を行いません。 Unicode から
Unicode の変換の際に -x と共に指定す る と、
nkf を UTF 形式の変換に用いることができま
す。(逆に言えば、これを指定しないと一部の文
字が保存されません)
パスに関わる文字列を変換する際には、このオプ
ションを指定することを強く推奨します。
http://sourceforge.jp/projects/nkf/document/nkf-man-2_0_6-ja/ja/4/nkf-man-2_0_6-ja.txt
ですね。
動作としては WideCharToMultiByte の WC_NO_BEST_FIT_CHARS と同じです。
http://www.microsoft.com/JAPAN/developer/library/jpwinpf/_win32_widechartomultibyte.htm
解説しますと、
そもそもの前提として、日本語で用いられる文字 - JIS X 0208 の、
Unicode との対応は定まったものではありません。
そのさまざまな JIS - Unicode 間の変換のうち、メジャーなものとして、
JIS の変換表を ASCII の範囲は変えないという変更を加えたものと、
Microsoft の用いている変換表 (CP932 シリーズ) があります。
nkf 2.0.7 では入力としては双方を受け入れ、
デフォルトではある種の正規化を行い、
デフォルトで JIS 風に出力します。
そのため、先の例では U+FFF5 を受け入れ、U+301C を出力しています。
なので、先の例で意図した出力を得るには、
1. nkf 内部でのある種の正規化を行わない → --no-best-fit-chars
2. 出力を CP932 風にする → --cp932
のどちらかを指定する、ということになります。
ただ、その「意図している出力」が「正しい出力」かは難しいところです。
ユーザ側が JIS 風の Unicode と CP932 風の Unicode、
どちらを求めているかはわたしには判断できません。
Windows な人は CP932 風でないと読めない文字もありますが、
他の環境のことはわからないので・・・。
--
NARUSE, Yui <naruse@airemix.com>
DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA