Eclipse Ganymede 上で UIMA SDK 1.4.5 を使い AE description を書く

参考ページ [1][2] を参照して UIMA の Analysis Engine Description を編集しようとするとエラーが発生することがある。 "The descriptor has one or more errors" というダイアログと共に "UIMARuntimeException" が発生する。 このエラーの原因は Xalan …

auひかりの速度測定

思い立って測定してみた。 (http://www.auone-net.jp/service/connect/speed_check/index.html) 個人マシンの Mac mini (PowerPC G4 1.5GHz, 主記憶1GB) は、今回の測定には非力すぎる。100BASE-Tでしかリンクアップしないし、測定を Java アプレットで行う…

FIREとFireWatch

FIREはオープンソース(ライセンスはGPL)の CBIR (Content-based Image Retrieval) エンジンである。フリーライセンスかつオープンソースな CBIR エンジンは、 英語版Wikipedia の "List of CBIR Engines" 記事 が詳しい。ここを見ると、FIRE の他にも GIFT…

Data Mining 本を読む (3) 1.3 Fielded applications

現実のアプリケーションでは、新しいデータに対してよい性能を出す(機械学習システムを作る)ことはもちろん重要だが、知識を習得することも同様か、もしくはそれ以上に重要である。 判定を含む決定 (見出しが直訳過ぎて自分でも笑ってしまう…あくまでメモ…

Data Mining 本を読む (2) 1.2 Simple examples: Thea weather problem and others

この本では例をたくさん出して学習を進めていく 異なるデータセットがそれぞれ新しい課題を示してくれる 異なるデータセットを検討することは重要だ。異なるアルゴリズムをテストするために、100程度のデータからなるコーパスがたくさん集められてきたくらい…

Data Mining 本を読む (1) 1.1 Data mining and machine learning

機械学習の利用例 人工授精では、成功しそうな受精卵を子宮に戻す必要があるが、選択基準になる要素が60ある。そこで機械学習の利用が検討されている。 ニュージーランドの酪農家は、季節の終わりに、乳牛を肉食用として売却するか残しておくかの判断をしな…

ブログ選びをした感想

今回ブログを復活させるにあたって、 はてなダイアリー, fc2, ココログ を比較してみた。その結果、ココログに落ち着いた。ポイントは「広告がない」「Markdown 記法」のふたつ。 広告 fc2ブログは広告がついて邪魔だった。 ココログもフリーだと広告がつく…

Data Mining 本を読む (0) 書誌情報と個別記事へのリンク

書誌情報 Ian H. Witten and Eibe Frank (2005).Data Mining: Practical Machine Learning Tools and Techniques.Morgan Kaufuann.(amazon.co.jp) もうすぐ第三版が出る予定らしい。 著者の一人 Witten 先生は Witten-Bell smoothing の人。New Zealand 在住…

Retrieval of On-line Hand-Drawn Sketches

文献情報 (Link to the entry on the ACM Digital Libary) Anoop M. Namboodiri and Anil K. Jain (2004): Retrieval of On-line Hand-Drawn Sketches. In Proc. of the 17th International Conference on Pattern Recognition (ICPR '04) Approach グラフマ…

ETC 割引備忘録

割引スキームが多すぎるのでメモ(横浜町田IC or 相模湖IC用)。 名称時間帯(付帯制限)回数制限距離制限出入口制限割引適用区間割引率(%)備考 通勤割引(夕) 17-20 1 100km以内 - 大都市近郊区間除く 50 深夜割引 22-23(出口) - - 裾野-東京 - 20 東…

subversion リポジトリのバックアップストラテジ

svn

そこら中に資料はあっても具体的運用方法に関する記述が少ないように感じたので、subversionリポジトリのバックアップストラテジーを考えてみました。以下のような方法です。 提案 subversion ツール群についての知識がある場合は、svnadmin dump と hot-bac…

RefTeX vs. YaTeX: どっちが \ref をうまく記述できるか

tex

YaTeX で C-c s SPC ref とたたいて \ref の挿入をするとき、もしも対象となるセクション(とか図とか式とか)に \label がない場合、自動的に label を生成してくれる機能がある(ユーザにラベルを入力するよう尋ねてくる)。が、そのとき出てくる補完リス…

括弧の前後/カンマの後に空白を置いて、句読点を統一する ruby スクリプト

半角英数字の開き括弧の前、閉じ括弧の後、カンマの後には空白が必要。それを忘れてしまったときに使うスクリプト。 日曜日に必要に迫られて書いてみた。ついでに句読点も統一する。 $KCODE="SJIS" ARGV.each do |file| File.rename(file,file+".bak") src =…

TeX でファイルパスを記述する方法

tex

url.sty パッケージを使うと、URLもしくはそれに類する文字列を整形して表示してくれる。しかしファイルパスのように、スペース文字を含んでいる文字列を表示しようとするとうまくいかない。なぜならurl.styパッケージはデフォルトであらゆるスペース文字を…

OpenOffice.org の SDK を使う

English, Japanese), they contains some old information. Followings are the simple directions to create a new UNO-IDL project with Eclipse IDE. get the installation packages of OpenOffice.org 2.1 and OpenOffice 2.1 SDK from openoffice.org, …

dvipdfmx で ¥CID{} でしか出ない字体を出力する

前回の設定だけでは、Unicode の BMP から外れた異体字(土口の「吉」など)は PDF に変換できません(Adobe-Japan1-6 の CMap がない、と言われる)。 対処方法は 「CMap を別途入手する」です。またまた奥村先生のページを参考にします。O'reilly の ftp …

TeXでUNICODE文字を書く

tex

年末に書店へ行ったら、奥村晴彦著「[改訂第4版]LaTeX2e美文書作成入門」が並べてあったので、買ってきました。第2版から買い続けているものの、未だに細かいところでアップデートが行われているので、買っておいて損はないと思います。 今回の改版は、私…