Wolfram Research製品ご購入サービスとリソース会社概要その他のWolframサイト
What is New in Mathematica 5.1 製品
-----
 /
Mathematica
<文字列操作
*DatabaseLink
*バイナリデータI/O
*追加されたインポート・エキスポート形式
*Webサービス
*大規模なグラフレイアウト
*配列の視覚化
*強化された線形代数
*区分関数
*領域上の積分
*イベント操作
*記号的微分方程式
*クラスタ分析
*EquationTrekker
*MathematicaMark2004
*GUIKit
*新機能のまとめ
*このページについてのお問い合せ
戻る進む

頑強な文字列操作

Wolfram Mathematica 6の新機能をご覧ください

Mathematica文字列の操作,マッチ,検索のための包括的な機能が組み込まれ,高レベルのパターンマッチシステムがさらに強力になりました.

パターンマッチは,Mathematica の言語,使いやすさ,一般的な式の操作機能の中核となっています.今ではギガバイトのサイズの文字列に適したパフォーマンスで,文字列データも同様に操作できるようになりました.このような機能と,広範な記号言語,計算機能の統合により,Mathematica はWebサイトの編集,データマイニング,DNA処理等のテキスト凝集型の分野にも応用することができます.

Mathematica の高レベルシンタックスで文字列パターンを形成するのと同様に,低レベルの正規表現も直接入力できるのでPerlおよびPythonユーザも容易にMathematica に切り替えることができます.




詳細

 例題ノートブックのダウンロード

例:バイオインフォーマティックス

以下はSARSウィルスのゲノムを与える文字列の初めの部分です.

CTACCCAGGAAAAGCCAACCAACCTCGATCTCTTGTAGATCTGTTCTCTAAACGAACTTTAAAATCTGTGTAGCTGTCGCTCG
GCTGCATGCCTAGTGCACCTACGCAGTATAAACAATAATAAATTTTACTGTCGTTGACAAGAAACGAGTAACTCGTCCCTCTT
CTGCAGACTGCTTACGGTTTCGTCCGTGTTGCAGTCGATCATCAGCATACCTAGGTTTCGTCCGGGTGTGACCGAAAGGTAAG
ATGGAGAGCCTTGTTCTTGGTGTCAACGAGAAAACACACGTCCAACTCAGTTTGCCTGTCCTTCAGGTTAGAGACGTGCTAGT
GCGTGGCTTCGGGGACTCTGTGGAAGAGGCCCTATCGGAGGCACGTGAACACCTCAAAAATGGCACTTGTGGTCTAGTAGAGC
TGGAAAAAGGCGTACTGCCCCAGCTTGAACAGCCCTATGTGTTCATTAAACGTTCTGATGCCTTAAGCACCAATCACGGCCAC
AAGGT...

以下でSARSゲノムの短いパリンドローム(回文配列)を見付けます.

In[1]:=StringCases[SARS, x_ ~ ~ y_ ~ ~ x_ ~ ~ x_ ~ ~ x_ ~ ~ y_ ~ ~ x_]

Out[1]:= {TCTTTCT, ACAAACA, CTCCCTC, TATTTAT, TCTTTCT, TCTTTCT, GTGGGTG, TCTTTCT, TCTTTCT, TGTTTGT, TATTTAT, ACAAACA, ACAAACA, TATTTAT, ACAAACA, ATAAATA, TCTTTCT, TGTTTGT, ACAAACA, TATTTAT, AAAAAAA, TTTTTTT, ATAAATA, ACAAACA, AGAAAGA, GAGGGAG, ACAAACA, AAAAAAA, AAAAAAA, AAAAAAA}

同一文字が長く繰り返されているものを見付けます.

In[2]:= StringCases[SARS, w : ((x_) ..) /; StringLength[w] > 5]

Out[2]:= {CCCCCC, GGGGGG, AAAAAAAA, TTTTTTT, TTTTTT, CCCCCC, AAAAAAAAAAAAAAAAAAAAAAAA}


 例題ノートブックのダウンロード
例:辞書

Mathematica 5.1には9万語に及ぶ英語辞書が含まれています.

この辞書の中で回文構造を持つものを探します.

In[3]:= FindWords[x__ /; x == StringReverse[x]]

Out[3]:= {a, aha, aka, bib, bob, boob, bub, CFC, civic, dad, dd, deed, deified, did, dud, DVD, eke, ere, eve, ewe, eye, gag, gig, huh, I, kayak, kook, level, ma'am, madam, mam, MGM, minim, mom, mum, nan, non, noon, nun, oho, pap, peep, pep, pip, poop, pop, pup, radar, redder, refer, repaper, reviver, rotor, sagas, sees, seres, sexes, shahs, sis, solos, SOS, stats, stets, tat, tenet, tit, TNT, toot, tot, tut, wow, WWW}


関連リンク

Mathematicaブックからのチュートリアル  Mathematica ブックからのチュートリアル
文字列の操作
文字列パターン
発展:正規表現
  
組込み関数ガイド 組込み関数ガイド
StringExpression
RegularExpression
StringCases
StringCount
StringDrop
StringFreeQ
StringInsert
StringLength
StringMatchQ
StringPosition
StringReplace
StringReplaceList
StringReplacePart
StringReverse
StringSplit
StringTake
  
アドバンスドキュメント  アドバンスドキュメント
Mathematica における文字列パターン
  
その他の情報  その他の情報
コンファレンス発表:String Patterns


トップへ 戻る進む



 © 2008 Wolfram Research, Inc.  Terms of Use  Privacy Policy | [en]