2010-01-01から1年間の記事一覧

8万円以内で8TBのサーバを作る

材料 HP ProLiant MicroServer (\35,700) http://h50146.www5.hp.com/products/servers/proliant/micro/ 2TBのHDD * 4本 (4万円前後): 今回は,日立製 0S02602 Deskstar バルク品を買うときには,HDDを留めるネジが別途必要(HPの本体に付いてこない)なので…

FASTAファイルをGREPするスクリプト

FASTAファイルをアノテーションや配列でgrepする事は度々あるのですが,シェルのgrepだと合致した行だけが出てきて,そのアノテーションを含む配列が何であったか,あるいは,その配列を含む配列の注釈は何かを調べるには一手間必要です.以下のスクリプトは…

並列分散ファイルシステムLustreを試してみた

速度が出なかったのは,100Mのハブに何故か繋がってたからでした.ということで速度書き直しました. 1台では容量が足りないという場合や,速度が足りないという場合用の並列ファイルシステム.最近クラスタやスパコンで使われるようになったlustreをインス…

BowtieとBWAのインストール

次世代シークエンサのマッピング関係のソフトは成熟度がまだであるせいか、パイプラインの一部にしか成らないのを自覚しているせいか、インストーラが付いていません。なので、普通にコンパイルして、PATHの通っているディレクトリに置きましょう。 Bowtie, …

膨大なFastaファイルを一定配列数で分割するスクリプト

学生の練習問題的な感じですが,作ったのでメモを残しておきます.以下の様にすると,input.fasta内の配列を1000本ずつに分けて,input.0001.fasta, input.0002.fasta,... というファイルに保存します. ruby seq_split.rb input.fastaオプションは -o : 出…

BLASTの結果をSAM形式に変換するスクリプト

BLAST(blastn)の結果を次世代シークエンサで使われるSAM形式に変換するスクリプトです.SAM toolsの中にも,blast2sam.plというperlスクリプトがあり,これのruby移植です. 少し拡張してあって,SAM toolsのblast2sam.plだと配列やquarity valueを出してく…

次世代シークエンサ(NGS)解析で使われるソフトの簡単なまとめ

2010/5/25.EST assemblerのViewerに関して追記 2010/6/9. ちょいちょい追記しています. 2010/7/26. ちょいちょい編集しました. 少し調べたのでまとめを晒してみる.比較的よく使われて沿うなソフトをまとめてみました.既に解析をガシガシやられている先…

2010年第1四半期の1言読書感想文

英語のバカヤロー! ~「英語の壁」に挑んだ12人の日本人~posted with amazlet at 10.04.03古屋裕子 泰文堂 売り上げランキング: 213885Amazon.co.jp で詳細を見る様々な分野の有名人にインタビューして,英語との関わりをインタビューしてまとめた本.この手…

データ整備・解析のためのインフラ整備について

この数ヶ月で,国内の複数の研究所の方々とお話しさせて頂く機会があったのですが,バイオインフォで重要と私が思っていている大量データを扱うためのインフラ整備が後手に回っている印象を受けました.色々な要因があるとは思うのですが,一つの側面につい…

研究室配属診断の反省

研究室配属後のテーマ選びは基本的に学生の興味を最優先していますが, そのテーマに潜む問題と,学生のスキルや本当の興味に不一致が毎年生じるので, 診断テストを用意してみました.その反省,という名の自分メモ. 今年の問題 文字列操作と数え上げ,散…

遺伝子発現から見た様々な生体情報解析の繋がり

遺伝子発現を中心に,様々な生命情報の繋がりを書いて見ました.取捨選択したつもりですが,無計画にレイアウトしてしまったので,大分ごちゃごちゃしてます. 図の中は大ざっぱに言って 矢印=情報の繋がり 黄土色の文字=手法(遺伝子発現をクラスタリング…

生命情報学系論文誌の傾向と対策

幸せなバイオインフォマティクス研究生活を送るために、論文誌の傾向と対策です。バイオインフォマティクス(生命情報学、生物情報学)分野は幅広い生命科学分野をカバーしているので雑誌によって傾向があります。その傾向をまとめてみました。円の大きさは…

情報系の人が生命科学者のモチベーションを知るのに有用かもしれない統合TV 10選

Entrez SNP を使い倒す(前編)PubMed/OMIMへの扉をひらく Entrez SNP を使い倒す(後編)下戸遺伝子の多型をさぐる 新たなる有用遺伝子候補を探索する 高速アラインメントツールBLATをプライマー設計支援ツールとして使い倒す2009 遺伝子発現データの活用事…

TM値計算用スクリプト

BioRubyの中に見つからなかったので,書きました. BioPHPのhttp://www.biophp.org/minitools/melting_temperature/を参照,というかコピーしています.(ライセンスはGPL) コマンドラインから引数に配列を与えます. % ruby tm.rb TTGCTTTCGAACAGTAGACAACATT…