ruby-list

片山です。

06/06/21 に Norihito Shinzan (Jun
Kabbalah)<kabbalah@proc.org.tohoku.ac.jp> さんは書きました:
>  最初の質問時に「BioRubyを使ってGenBankデータを処理しようとしています」
> と対象データ・使用ライブラリを断っておけば皆さんも混乱しなかったと思いま
> す(^^;

そうですね。
BioRuby をお使いの場合は少し方法が違っていたのですが
たどり着かれたようなのでそれは良いとして、 ^^;


> ＃ていうか、GenBank のフォーマットにとって空行に何の意味もないなら
> ＃BioRuby 側で読み飛ばしてくれればいいんじゃないかと思ってみたり。

GenBank は遺伝子やゲノムの DNA シーケンスと付随する情報を
自然言語で記述する際に使われる代表的なフォーマットの一つなのですが、
小さな遺伝子から巨大なゲノムまで使い回されているおかげで、
以下のような状況になっています：

* BioRuby では１行ごとではなく // で区切られた複数行（エントリ）ごとに読み込んでいる
* エントリのサイズは数KBのものから数百MBのものまで混在し得る
* GenBank フォーマットの規格として空行は存在しないことになっている

読み込んだエントリに空行が無いかチェックするのは、
エントリが巨大だった場合に少しパフォーマンスが悪くなりそうです。
（そうでもないのかな、、）

ちなみに、エントリの前後についている white spaces は strip していますので、
今回のケースはエントリの中に空行があるのかなと想像していますが、

* どうすればそんなデータが得られたのか（わりと一般的に起こりうる事かどうか）
* 実際のデータ
* エラーメッセージ
* やろうとしていたこと（とうまくいかなかったこと）

などを BioRuby のメーリングリストか個人宛にメールして頂ければ改良できるかもしれません。
（場合によってはデータの取り方を変える方が早いかもしれません^^;）

ではでは。

Thread

Prev Next

In This Thread

Prev Next

[#42346] Re: ディレクトリーを再帰下降していくスクリプトでNoMemoryErrorエラー — 岩崎 弘孝 <IH000667@...>

[#42348] win32oleの「メソッドが無い」というランタイムエラー — "conundrum" <conundrum@...>

[#42349] Re: ディレクトリーを再帰下降していくスクリプトでNoMemoryErrorエラー — 岩崎 弘孝 <IH000667@...>

[#42351] Re: ディレクトリーを再帰下降していくスクリプトでNoMemoryErrorエラー — 岩崎 弘孝 <IH000667@...>

[#42354] [ANN]Miyako v0.7リリース！ — cyross@...

[#42355] TkCanvasの座標 — Masato Ishimoto <i@...>

[#42367] [ANN] RubyKaigi2006：最後のご案内 — SASADA Koichi <ko1@...>

[#42370] [ANN] 超簡単プレゼンツール 高橋マインド — "ARAI Shunichi" <arai@...>

[#42371] MySQL/Ruby for Windowsでの不具合 — 林 浩一郎 <NQA58508@...>

[#42372] MySQL/Ruby for Windows での不具合 — 林 浩一郎 <NQA58508@...>

[#42373] My/SQL/Ruby for Windows での不具合 — 林 浩一郎 <NQA58508@...>

[#42374] [ANN] Ruby-GetText-Package-1.6.0 — Masao Mutoh <mutoh@...>

[#42375] String#count, String#deleteの利用想定 — Daisuke Yamazaki <yamajaki@...>

[#42388] Rubyカンファレンスのレポート記事を公開させていただきました — TAKAHASHI Nobuyori <nob@...>

[#42389] ruby -Ks -rjcode -e"p('|%5.5s|'%'泣き別れ')" #=> "|泣き怖" — take_tk <ggb03124@...>

[#42394] eachはなぜ元々のオブジェクトが返るのか？ — Fujioka <fuj@...>

[#42400] open-uriに対してfile:を与えるとEINVALなどになる — arton <artonx@...>

[#42405] RubyはSUNを殺すのか — Omoti <omoti@...24.net>

[#42412] Ruby/OpenSSL samples at RubyKaigi2006 — "NAKAMURA, Hiroshi" <nakahiro@...>

[#42414] 正規表現 [^/] がエラー??? — しん <dezawa@...>

[#42416] ファイル中の空行の削除方法 — 遠藤 大二 <dendoh@...>

[#42421] D0ct0r rec0mmendati0ns — "Reba" <rubikitch@...>

[#42423] 空白行を除くための行数の数え方 — 遠藤 大二 <dendoh@...>

[#42426] [ANN] Exerb 4.0.0-preview1 — "Yuya Kato" <yuyakato@...>

[#42428] toplevel ウィジェットにイベントがわたらない？ — Hiroshi Kimura <Hiroshi.Kimura@...>

[#42437] DHHさんのインタビューを公開させていただきました — TAKAHASHI Nobuyori <nob@...>

[#42443] 日本語でのString#casecmpの利用について — Eito Katagiri <eito@...>

[#42444] Re: rubyで多次元配列の作り方 — "Ken'ichi Saitou" <hff@...>

[#42447] Re: rubyで多次元配列の作り方 — rubikitch <rubikitch@...>

[#42448] Re: rubyで多次元配列の作り方 — "Hiroyuki Iwatsuki" <don@...>

[#42452] ReFeデータベース構築失敗 — MIYAJIMA Mitsuharu <miya@...>

[#42454] 多量の正規表現との効率的なマッチのアイデアを、、 — しん <dezawa@...>

[#42462] St0p waste y0ur m0ney n0w cheap pills same result — "Sondra" <rubikitch@...>

[#42466] Affordable medicine directly fr0m manufacturer — "Lucy" <rubikitch@...>

[#42475] String#first, String#last — Kouhei Yanagita <yanagi@...>

[#42476] Gtk::FileSelection の filename= — Takeshi Honda <moecho21@...>

[#42477] endがkendと認識される — 林 浩一郎 <NQA58508@...>

[#42481] 書籍について — 林 浩一郎 <NQA58508@...>

[#42492] [ANN] Lightweight Language Ring チケット発売開始 — SASADA Koichi <ko1@...>

[#42495] ｓｌｅｅｐ等の不可解な問題発生（なぜでしょうか） — "Hisashi Yahata" <yahatah@...>

[#42499] Effective medicine cOuld be cheap! — "Trudy" <rubikitch@...>

[#42500] Seas0n sales! Cheap tabs! — "Genaro" <rubikitch@...>

[#42501] [ANN] Rubyist Magazine 日本 Ruby カンファレンス 2006 特別号 — maili31s@... (SugHimsi==SUGIHARA Hiroshi)

[ruby-list:42440] Re: 空白行を除くための行数の数え方

Thread

In This Thread

[#42346] Re: ディレクトリーを再帰下降していくスクリプトでNoMemoryErrorエラー — 岩崎弘孝 <IH000667@...>

[#42349] Re: ディレクトリーを再帰下降していくスクリプトでNoMemoryErrorエラー — 岩崎弘孝 <IH000667@...>

[#42351] Re: ディレクトリーを再帰下降していくスクリプトでNoMemoryErrorエラー — 岩崎弘孝 <IH000667@...>

[#42370] [ANN] 超簡単プレゼンツール高橋マインド — "ARAI Shunichi" <arai@...>

[#42371] MySQL/Ruby for Windowsでの不具合 — 林　浩一郎 <NQA58508@...>

[#42372] MySQL/Ruby for Windows での不具合 — 林　浩一郎 <NQA58508@...>

[#42373] My/SQL/Ruby for Windows での不具合 — 林　浩一郎 <NQA58508@...>

[#42416] ファイル中の空行の削除方法 — 遠藤大二 <dendoh@...>

[#42423] 空白行を除くための行数の数え方 — 遠藤大二 <dendoh@...>

[#42477] endがkendと認識される — 林　浩一郎 <NQA58508@...>

[#42481] 書籍について — 林　浩一郎 <NQA58508@...>