homebrewでnumpy/matplotlabのインストール

以下を参照.パーミッションエラーが起きるけど,無視して進んでOK.パーミッションを正しく(?)設定していると,brew linkをしてくださいと言われるので,従う. http://www.thisisthegreenroom.com/2011/installing-python-numpy-scipy-matplotlib-and-ipyt…

RとPython(NumPy)の対応

対応表 NumPy for R users: http://mathesaurus.sourceforge.net/r-numpy.html Rのdata.frameに相当する事を実現するには 作成:NumPyのarrayで,各列にclassを指定できる (structured arrays) http://docs.scipy.org/doc/numpy/user/basics.rec.html > impo…

お茶大から東工大に3年間レンタル移籍します

エープリルフールネタではないので,少しフライングで公開します.3月31日で丸5年間お世話になったお茶の水女子大学を退職し,4月1日より東京工業大学 大学院情報理工学研究科 計算工学専攻の准教授として赴任する事になりました.ただし,通常の異動ではな…

イシューからはじめよ―知的生産の「シンプルな本質」

本書はビジネス書ではあるのですが,著者が脳神経科学で博士号を有しており,本書の内容も随所に研究の話が出てきます.なので,研究者にもおすすめです. 特に,プロジェクトを進めたり,論文を書いたりする上で,ストーリーを作って,それに必要なパーツを…

ビジネスのためのデザイン思考

この本と次の本はビジネス書です.いずれもタイトルは異なりますが,主軸としている内容は一緒で「ものつくりは成熟してきた.これから重要なのはそれらを活かすストーリーだ」というストーリーを主軸にする考え方で,ストーリーを考えることで,意味あるも…

「こころ」は遺伝子でどこまで決まるのか―パーソナルゲノム時代の脳科学 (宮川 剛)

ゲノムと脳の関係は,私自身の興味でもあり,楽しく読めました. また,著者の宮川先生の研究で作成されている「網羅的行動テストバッテリー」は,私が大学院生だったか,助手時代だったか忘れましたが,参加させていただいた科学研究費の会議で,その話を拝…

闘う! ウイルス・バスターズ 最先端医学からの挑戦 (河岡義裕,渡辺登喜子)

ウイルスで有名な河岡先生と渡辺先生の本.今,研究者に進むか,会社に務めるか迷っている人(特に生命系)が居たら,読んでみることをおすすめします.研究者が必ずしも小さい頃から「その道」を選んでいるわけではなく,環境によって,色々進路が分かれて…

積ん読の解体

旅行が地震の影響で,飛行機が飛ばずキャンセルになったので,積ん読していた本を順に読んでいました.感想文です.4冊とも面白く読めました.

Rによるバイオインフォマティクスデータ解析(第2版)

著者の樋口さんより献本頂きました.ありがとうございます. この本が合う人は明確です. Rで何が出来るか眺めたい. Rを使い始めて,使い方を検索エンジンで検索したが,全然見つからない(入れるべき単語が分からない) RJpWikiとか眺めたけど,専門用語っ…

8万円以内で8TBのサーバを作る

材料 HP ProLiant MicroServer (\35,700) http://h50146.www5.hp.com/products/servers/proliant/micro/ 2TBのHDD * 4本 (4万円前後): 今回は,日立製 0S02602 Deskstar バルク品を買うときには,HDDを留めるネジが別途必要(HPの本体に付いてこない)なので…

FASTAファイルをGREPするスクリプト

FASTAファイルをアノテーションや配列でgrepする事は度々あるのですが,シェルのgrepだと合致した行だけが出てきて,そのアノテーションを含む配列が何であったか,あるいは,その配列を含む配列の注釈は何かを調べるには一手間必要です.以下のスクリプトは…

並列分散ファイルシステムLustreを試してみた

速度が出なかったのは,100Mのハブに何故か繋がってたからでした.ということで速度書き直しました. 1台では容量が足りないという場合や,速度が足りないという場合用の並列ファイルシステム.最近クラスタやスパコンで使われるようになったlustreをインス…

BowtieとBWAのインストール

次世代シークエンサのマッピング関係のソフトは成熟度がまだであるせいか、パイプラインの一部にしか成らないのを自覚しているせいか、インストーラが付いていません。なので、普通にコンパイルして、PATHの通っているディレクトリに置きましょう。 Bowtie, …

膨大なFastaファイルを一定配列数で分割するスクリプト

学生の練習問題的な感じですが,作ったのでメモを残しておきます.以下の様にすると,input.fasta内の配列を1000本ずつに分けて,input.0001.fasta, input.0002.fasta,... というファイルに保存します. ruby seq_split.rb input.fastaオプションは -o : 出…

BLASTの結果をSAM形式に変換するスクリプト

BLAST(blastn)の結果を次世代シークエンサで使われるSAM形式に変換するスクリプトです.SAM toolsの中にも,blast2sam.plというperlスクリプトがあり,これのruby移植です. 少し拡張してあって,SAM toolsのblast2sam.plだと配列やquarity valueを出してく…

次世代シークエンサ(NGS)解析で使われるソフトの簡単なまとめ

2010/5/25.EST assemblerのViewerに関して追記 2010/6/9. ちょいちょい追記しています. 2010/7/26. ちょいちょい編集しました. 少し調べたのでまとめを晒してみる.比較的よく使われて沿うなソフトをまとめてみました.既に解析をガシガシやられている先…

2010年第1四半期の1言読書感想文

英語のバカヤロー! ~「英語の壁」に挑んだ12人の日本人~posted with amazlet at 10.04.03古屋裕子 泰文堂 売り上げランキング: 213885Amazon.co.jp で詳細を見る様々な分野の有名人にインタビューして,英語との関わりをインタビューしてまとめた本.この手…

データ整備・解析のためのインフラ整備について

この数ヶ月で,国内の複数の研究所の方々とお話しさせて頂く機会があったのですが,バイオインフォで重要と私が思っていている大量データを扱うためのインフラ整備が後手に回っている印象を受けました.色々な要因があるとは思うのですが,一つの側面につい…

研究室配属診断の反省

研究室配属後のテーマ選びは基本的に学生の興味を最優先していますが, そのテーマに潜む問題と,学生のスキルや本当の興味に不一致が毎年生じるので, 診断テストを用意してみました.その反省,という名の自分メモ. 今年の問題 文字列操作と数え上げ,散…

遺伝子発現から見た様々な生体情報解析の繋がり

遺伝子発現を中心に,様々な生命情報の繋がりを書いて見ました.取捨選択したつもりですが,無計画にレイアウトしてしまったので,大分ごちゃごちゃしてます. 図の中は大ざっぱに言って 矢印=情報の繋がり 黄土色の文字=手法(遺伝子発現をクラスタリング…

生命情報学系論文誌の傾向と対策

幸せなバイオインフォマティクス研究生活を送るために、論文誌の傾向と対策です。バイオインフォマティクス(生命情報学、生物情報学)分野は幅広い生命科学分野をカバーしているので雑誌によって傾向があります。その傾向をまとめてみました。円の大きさは…

情報系の人が生命科学者のモチベーションを知るのに有用かもしれない統合TV 10選

Entrez SNP を使い倒す(前編)PubMed/OMIMへの扉をひらく Entrez SNP を使い倒す(後編)下戸遺伝子の多型をさぐる 新たなる有用遺伝子候補を探索する 高速アラインメントツールBLATをプライマー設計支援ツールとして使い倒す2009 遺伝子発現データの活用事…

TM値計算用スクリプト

BioRubyの中に見つからなかったので,書きました. BioPHPのhttp://www.biophp.org/minitools/melting_temperature/を参照,というかコピーしています.(ライセンスはGPL) コマンドラインから引数に配列を与えます. % ruby tm.rb TTGCTTTCGAACAGTAGACAACATT…

IEEE BIBM 2009 の講演内容メモ

ちなみに来年は,香港, 12/18-21 です.http://www.math.hkbu.edu.hk/BIBM2010/ーーーーーーーー Chris Sander 物理からガンの生物学へ- ガンの細胞動態は複雑である. 複雑なデータから単純なモデルを導出したい. http://www.ncbi.nlm.nih.gov/pubmed/1876…

MacBook Pro 13インチのHDDをSSDに換装

CPU/HDD的にヘビーな仕事が続くので、MacBook Pro 13インチを購入してSSDに換装しました。 やってきましたSSD。SAMSUNGの256GB、MLCのものです。外側にICチップとか全く無いのがかっちょよい(後のSSD装着後の写真参照) まずは、USBで外に付けてHDDの中身を…

Rubyで翻訳

Google AJAX APIを叩いて翻訳するライブラリを使うと、簡単に翻訳できます。(信頼性は保証しません:p) 準備 1.3.1以上のgemを用意します。1.2以前のバージョンの場合は以下を行ってバージョンアップ(今は1.3.4)します。 % sudo gem install rubygems-updat…

OMIMのエントリを自動翻訳するスクリプト

遺伝病辞典のOMIMは私の様なnon-native かつ門外漢な人には、ひじょーに理解じにくい。でも、大量にざーっとチェックしたいな−と思うときがあるので、日本語になっていると便利かも?というわけで、OMIMをひたすら機械翻訳するスクリプト作りました。 このエ…

BioGPS(SymAtlas)組織名の日本語版を作ってみました

Wikipediaの遺伝子発現量表示(e.g. http://en.wikipedia.org/wiki/P53 )にも使われているBioGPS ( http://biogps.gnf.org/ )の組織名を日本語にしてみました(Humanのみ)。門外漢なので、突っ込み歓迎です! あと、勝手に組織の系統を付けてみました。翻訳に…

遺伝子のプロモータ配列を簡単に得るスクリプト

遺伝子のプロモータを得るだけのために、各種ゲノム配列を準備するのは面倒。NCBI のE-Utils利用すると、ゲノム配列の準備とかしなくても、プロモータ配列が得られます*1。準備するもの ruby rubygems xmlsimple ネットワーク環境 プロモータを得たい遺伝子…

サーバ管理を理解するための10の心得

「サーバ管理、お願い」「なにすればいいんですか?」 という質問に対しての答え文章です。具体的な作業は、その場その場で異なりますし、ネットに情報が繁茂しているので、ここでは心得的なものを示します。1. 管理する状況を作ろう なんといっても、管理す…