bioinformatics

FASTAファイルをGREPするスクリプト

FASTAファイルをアノテーションや配列でgrepする事は度々あるのですが,シェルのgrepだと合致した行だけが出てきて,そのアノテーションを含む配列が何であったか,あるいは,その配列を含む配列の注釈は何かを調べるには一手間必要です.以下のスクリプトは…

BowtieとBWAのインストール

次世代シークエンサのマッピング関係のソフトは成熟度がまだであるせいか、パイプラインの一部にしか成らないのを自覚しているせいか、インストーラが付いていません。なので、普通にコンパイルして、PATHの通っているディレクトリに置きましょう。 Bowtie, …

膨大なFastaファイルを一定配列数で分割するスクリプト

学生の練習問題的な感じですが,作ったのでメモを残しておきます.以下の様にすると,input.fasta内の配列を1000本ずつに分けて,input.0001.fasta, input.0002.fasta,... というファイルに保存します. ruby seq_split.rb input.fastaオプションは -o : 出…

BLASTの結果をSAM形式に変換するスクリプト

BLAST(blastn)の結果を次世代シークエンサで使われるSAM形式に変換するスクリプトです.SAM toolsの中にも,blast2sam.plというperlスクリプトがあり,これのruby移植です. 少し拡張してあって,SAM toolsのblast2sam.plだと配列やquarity valueを出してく…

次世代シークエンサ(NGS)解析で使われるソフトの簡単なまとめ

2010/5/25.EST assemblerのViewerに関して追記 2010/6/9. ちょいちょい追記しています. 2010/7/26. ちょいちょい編集しました. 少し調べたのでまとめを晒してみる.比較的よく使われて沿うなソフトをまとめてみました.既に解析をガシガシやられている先…

データ整備・解析のためのインフラ整備について

この数ヶ月で,国内の複数の研究所の方々とお話しさせて頂く機会があったのですが,バイオインフォで重要と私が思っていている大量データを扱うためのインフラ整備が後手に回っている印象を受けました.色々な要因があるとは思うのですが,一つの側面につい…

遺伝子発現から見た様々な生体情報解析の繋がり

遺伝子発現を中心に,様々な生命情報の繋がりを書いて見ました.取捨選択したつもりですが,無計画にレイアウトしてしまったので,大分ごちゃごちゃしてます. 図の中は大ざっぱに言って 矢印=情報の繋がり 黄土色の文字=手法(遺伝子発現をクラスタリング…

生命情報学系論文誌の傾向と対策

幸せなバイオインフォマティクス研究生活を送るために、論文誌の傾向と対策です。バイオインフォマティクス(生命情報学、生物情報学)分野は幅広い生命科学分野をカバーしているので雑誌によって傾向があります。その傾向をまとめてみました。円の大きさは…

情報系の人が生命科学者のモチベーションを知るのに有用かもしれない統合TV 10選

Entrez SNP を使い倒す(前編)PubMed/OMIMへの扉をひらく Entrez SNP を使い倒す(後編)下戸遺伝子の多型をさぐる 新たなる有用遺伝子候補を探索する 高速アラインメントツールBLATをプライマー設計支援ツールとして使い倒す2009 遺伝子発現データの活用事…

IEEE BIBM 2009 の講演内容メモ

ちなみに来年は,香港, 12/18-21 です.http://www.math.hkbu.edu.hk/BIBM2010/ーーーーーーーー Chris Sander 物理からガンの生物学へ- ガンの細胞動態は複雑である. 複雑なデータから単純なモデルを導出したい. http://www.ncbi.nlm.nih.gov/pubmed/1876…

APBC 2009

The seventh asia pacific bioinformatics conference (APBC 2009)に来てます。 氷点下の北京は寒い。 Olga Troyanskaya の Tutorial ひたすら、P2PやTAPなどの実験方法を列挙 ひたすら、Bayesian NetworkやSVMなどをoverview 細かい話には一切入らない Davi…

Bioinformatics求職マップ

Bio-software より.Google Map上に,Bioinformaticsで求職している場所が現れます. http://www.bioinformatics.fr/jobs.php?mapview

DB Magazine 7月号の見本誌

2ページほど寄稿させていただいたDB Magazineの見本紙が届きました.明日発売かな. 自分の記事を開いた瞬間,誤字を発見したのは秘密です.orz.

TIBCOのSpotfire 買収

遅ればせながら, http://bonohu.jp/t/20070509.html#p01 で,Microarrayデータの解析でも利用されるデータマイニングソフトウエアSpotfireを作るSpotfire社が買収されるのを知る. "TIBCO and Spotfire" http://www.tibco.com/company/spotfire/default.jsp…

KEGGのXMLを少し調べてみた

NM番号の付いた遺伝子をKEGGにmapしたかったので調べたメモ. データの在処 ftp.genome.ad.jp:/pub/kegg/ PathwayのXML xml/map/ reference pathwayのもの ファイル名は "map" + $pathway_id + ".xml" xml/ko/ reference pathway(KO)のもの XML上のmapとの違…

KEGGのPathway MapのXMLをparseして,矢印の関係を書き出すJavaプログラム

KEGGのPathwayのデータ(ftp.genome.ad.jp/pub/kegg/xml/map 下の*.xmlとか,ftp.genome.ad.jp/pub/kegg/xml/organisms/*/*.xml とか)をparseして,KEGG上の図で矢印で現れている部分を表示するプログラム. java KEGGRelation map05214.xml とか動かすと k…

Ten Simple Rules for a Successful Collaboration

http://compbiol.plosjournals.org/perlserv/?request=get-document&doi=10.1371/journal.pcbi.0030044 後で読んで,感想を書く予定.(ここに)

Bioclipse 1.0

http://bioclipse.blogspot.com/2006/08/bioclipse-10-released.html Eclipseの上でPDBのエントリなどを見られるようにするBioclipseプラグインの1.0がリリースされています.たんぱく周りを扱う機会がないので,使ったことないのですが・・・. Eclipseのプ…

GOのDBを,PostgreSQLとMySQLで作成してみる

「http://d.hatena.ne.jp/sesejun/20060805」を書いた際に,PostgreSQLのDBにGO(Gene Ontology Resource)のデータを入れるのが,遅すぎる感じがしたので,MySQLで試してみた. MacBook Pro 上で,PostgreSQLを使ってhttp://www.se-se.jp/doc/go-postgres.htm…

GOのデータベースをPostgreSQLで作る

GO(http://www.geneontology/org)のデータベースはMySQL形式が公開されていますが, PostgreSQLでは,そのままでは動かないので,テーブル作成のSQLやデータを入れるスクリプトをまとめて, 「http://www.se-se.jp/doc/go-postgres.html(http://www.se-se.jp…

東工大での募集

東工大でバイオインフォマティクスを含んだ助教授・講師の募集をしていますね. http://www.dis.titech.ac.jp/other/application2006.html

担当講義のページ

bioinformaticsの担当講義のページを作り始めました. http://lab.se-se.jp/bioinfo/wiki/ 現在,Mac の説明だらけになっております^^;適宜,追加ということで. 本当は,Macの説明は適当に外部へのポインタで済まそうとおもったのだけど,良いページがなか…

TraceSearch: Sanger Centerの100倍高速な配列検索

TraceSearch - Google for the genome Sanger Institute's 100-fold faster DNA search engine ( http://www.sanger.ac.uk/Info/Press/2006/060321.shtml) 全生物種を検索して、3-5秒。Opteronクラスタを利用。

googleは遺伝子情報を支配するのか?

Googleの遺伝子プロジェクトが問題に - ITmedia NEWS では、 遺伝子の個人情報が問題視されていますが、個人情報は、どこかで流出されてない限りgoogle botが手に入れることはないので、問題になるのは、、、、、我々bioinformatistの仕事が食われることだ!

日経バイオビジネス休刊?

まだ、購読者向けの正式な連絡も来ていないのだが以下のURLに寄ると年内一杯で休刊らしい http://www.fx-it.com/kihon/top.html (ネタ元) http://slashdot.jp/articles/05/11/01/112219.shtml http://bonohu.jp/t/20051101.html#p04 バイオビジネスネタだけ…

GOコンソーシアムのアンケート

GOコンソーシアムが、競争的資金に応募するために、 利用者アンケートをしています。 資金が取れない場合には、縮小も余儀なくなるようです。 http://www.AdvancedSurvey.com/default.asp?SurveyID=32355 多かれ少なかれ、GOのデータは計算機屋と実験屋。あ…

学術系に特化したブックマーク、バイオロジに特化した検索エンジン

Bioinformatics.org に 科学系の検索エンジンネタが乗っていました。http://bioinformatics.org/forums/forum.php?forum_id=3683 3種類紹介されていて、3者3様です。 SCIRUS http://www.scirus.com/ Google Scholarの様な、汎用検索エンジン CONNOTEA htt…

BioWeka-0.4

http://www.bioweka.org/ Java basedなデータマイニングツールであるWekaのバイオ系拡張である、BioWekaの0.4が出ています。卒論でやってたのかな? 今のツールって、WekaにしてもRにしても、データが複雑になると、操作も、覚えるべきことも複雑になってい…

あなたが創るオープンバイオ

http://itoshi.tv/d/?date=20051017#p01 取り組み自身、賛成です。自分自身、しがらみ、という名の甘えた勝手な理由により、一歩目が踏み出せていない感が強いですが、開発者コミュニティを活性化していくのは賛成。開発者コミュニティが活性化することで、…

Shirley TILGHMAN、googleの取締役に

http://www.itmedia.co.jp/news/articles/0510/06/news019.html Googleの取締役として、ヒト・ゲノムの第一人者でプリンストン大学学長のシャーリー・ティルマン教授が迎えられた。 ぐげげげげ。Googleは、学長として経験した学識の広さを期待しているのか、…