-*- POD -*-
大阪大学大学院情報科学研究科
大崎 博之 (oosaki[atmark]ist.osaka-u.ac.jp)
Tips for writing preliminary paper draft
$Id: index.pod,v 1.4 2007/10/31 10:09:34 oosaki Exp $
論文で使用する用語を統一するため、まず最初に用語集を作成する。一般的で ない用語をすべてリストアップする (研究会の原稿なら 30 個程度)。以降、 論文、発表資料、口頭発表では、すべて同じ用語を使用する。
用語集の例:
グリッドコンピューティング
AIMD 型のフロー制御
パケット棄却
TCP ソケットバッファサイズ
並列データ転送
TCP コネクション
並列 TCP コネクション数
自動パラメータ設定機構
GridFTP クライアント
GridFTP サーバ
:
:
発表用のスライドを作るつもりで、Emacs の outline-mode を用いて、論文の アウトラインを作成する。outline-mode の利用方法や、outline-mode 形式か ら、LaTeX/HTML/PPT 形式への変換方法については以下のページを参照のこと。
Using Emacs' outline-mode for writing a paper outline/draft and presentation slides (2005/6/8)
http://www.ispl.jp/~oosaki/research/linux-tips/outline/
論文のアウトラインの例:
http://www.ispl.jp/~oosaki/research/tips-outline/outline-Ohsaki04_IN6.doc
http://www.ispl.jp/~oosaki/research/tips-outline/outline-Ohsaki05_IN2.doc
http://www.ispl.jp/~oosaki/research/tips-outline/outline-Ohsaki05_SAINT.doc
http://www.ispl.jp/~oosaki/research/tips-outline/outline-Yoshimura05_IN7.doc
まず、スライドタイトルを作成する。タイトルページを含めて、スライド 20 枚とする。基本的に、以下のような流れにする。通常、学会の口頭発表は 18 〜 25 分程度なので、これがそのまま (最低限の) 発表用のスライドとして使 える。
発表時間が 10 分程度でも、スライドの枚数は 20 枚とする。発表用のスライ ドは、この 20 枚から発表内容にあわせて後で取捨選択すればよい。
* タイトル
* 発表の内容
* 研究の背景
:
* 研究の目的
:
* まとめと今後の課題
何をどのくらい説明したいかを考えて、説明に必要なスライド数を決定する。 研究の背景が 30%、アルゴリズムの説明が 30%、評価の結果が 30%、まとめが 10% なら、スライドの枚数はおおよそ 3:3:3:1 の比率にする。スライドタイ トルの例は以下の通り。
* タイトルページ
* 発表の内容
* 研究の背景
* TCPの限界
* GridFTPの特徴
* 並列データ転送 (1)
* 並列データ転送 (2)
* 研究の目的
* 自動パラメータ設定機構の設計方針
* 基本的なアイディア (1)
* 基本的なアイディア (2)
* 基本的なアイディア (3)
* 自動パラメータ設定機構の概要
* 3 種類の動作モード
* 1. MI モード
* 2. MI モード + 並列 TCP コネクション数調整機構
* 3. AIMD モード
* シミュレーションによる性能評価
* シミュレーション結果
* まとめと今後の課題
スライドタイトルは箇条書の一種なので、同じ概念のものが並ぶことに注意。 例えば、上記の例では、すべて「名詞」が並んでいる。
用言で終わっている文を無理に「名詞」として終わらせようとして、間違った 省略をしている例が見受けられるので、ここで例をあげて説明する。例えば以 下の例では、
- GridFTP の問題点
- 並列 TCP コネクション数が大きすぎると性能が劣化 ← ○
- 並列 TCP コネクションを適切に設定する必要 ← ×
「劣化」の行は正しいが、「必要」の行 (「がある」を省略している) は誤り。 後者は、「必要する / 必要とする」と読めてしまう。以下の例では、
- GridFTP
- 大容量のデータを効率的に転送するためのプロトコル ← ○
- 既存の FTP にさまざまな機能が追加 ← ×
「プロトコル」の行は正しいが、「追加」の行 (「されている」を省略してい る) は誤り。「追加である」と読めてしまう。
基本的な原則として、「文末の「する (した)」・「である (であった)」は 省略できるが、それ以外は省略できない」と覚えておくと良い。
次に、各スライドの内容を作成する。スライドの例は以下の通り。
* 研究の目的
- GridFTP の自動パラメータ設定機構の提案
- クライアント側でネットワークの状態を計測
- 並列 TCP コネクション数を動的に調整
- ネットワーク資源を有効に利用
- 自動パラメータ設定機構の有効性を検証
- シミュレーションによる評価
このスライドタイトルに関して説明したい内容を、箇条書の項目としてリスト アップする。項目のレベルは、説明したい内容の抽象度にあわせる (つまり、 レベル 1 の項目は、レベル 2 の項目よりも大きな話になる)。
いくつの項目に分けるかは、全体のバランスを考えて決める。同じレベルの項 目のボリュームが同じくらいになるようにする。おおよその目安として、レベ ル 1 の項目が、論文における段落になると思えばよい。
上の例だと、「研究の目的」に関して言いたいことは 2 つあり、「GridFTP の自動パラメータ設定機構の提案」と「自動パラメータ設定機構の有効性を検 証」は同じくらいの抽象度の内容であることを意味している。
また、「GridFTP の自動パラメータ設定機構の提案」に関しては、言いたいこ とが 3 つあり、「自動パラメータ設定機構の有効性を検証」に関しては、言 いたいことが 1 つあることを意味している。
スライドタイトルと同様に、同じレベルの項目には、同じ概念のものが並ぶ。 今の例だと、「提案」と「検証」という抽象名詞が並んでいる。また、同じレ ベルの項目には、同じくらいの抽象度のものが並ぶので、各項目の長さは同じ くらいになる。
箇条書で、レベルの異なる項目間の関係が論理的に正しいかどうか、同じレベ ルの項目に同じ概念のものが並んでいるかは、以下のような手順でチェックす ればいい。例えば、上記のスライドの構成は以下のようになっている。
* A
- A1
- A11
- A12
- A13
- A2
- A21
まず、レベルの異なる項目間の関係が論理的に正しいかどうかをチェックする。 このために、
「A の抽象度 > A1 の抽象度 > A11 の抽象度」かつ
「A の抽象度 > A2 の抽象度 > A21 の抽象度」
であることをチェックする。また、
「A is/does/has A1 and/or A2」かつ
「A1 is/does/has A11 and/or A12 and/or A13」かつ
「A2 is/does/has A21」
が成立するかチェックする。
次に、同じレベルの項目に同じ概念のものが並んでいるかをチェックする。こ のために、
「A1 の概念 = A2 の概念」かつ
「A11 の概念 = A12 の概念 = A13 の概念」
であることをチェックする。上記の二つの条件がクリアされて いれば、自動的に
「A1 の抽象度 > A12 の抽象度」
「A1 の抽象度 > A13 の抽象度」
となっているはずである。
ここで、さきほどのスライドの例を見てみよう。
* 研究の目的
- GridFTP の自動パラメータ設定機構の提案
- クライアント側でネットワークの状態を計測
- 並列 TCP コネクション数を動的に調整
- ネットワーク資源を有効に利用
- 自動パラメータ設定機構の有効性を検証
- シミュレーションによる評価
連体詞や修飾節を除けば、上記のスライドの骨格は以下のようになっている。
* 目的
- 提案
- 計測
- 調整
- 利用
- 検証
- 評価
まず、レベルの異なる項目間の関係が論理的に正しいかどうかをチェックする。 この場合、
「目的 > 提案 > 計測」かつ
「目的 > 検証 > 評価」
のように、後になるほど具体的になっている。さらに、
「目的 is 提案 and 検証」かつ
「提案(方式) does 計測 and 調整 and 利用」かつ
「検証 is 評価」
という関係が成り立っている。
次に、同じレベルの項目に同じ概念のものが並んでいるかをチェックする。上 記の例だと、
「提案 = 検証」かつ
「計測 = 調整 = 利用」
のように、同じレベルの概念が並んでいる。
その後、スライドのタイトをもとに章構成を作成する。これをスライド 2 ペー ジ目の「発表の内容」とする。例えば、スライドタイトルが以下のようであれば、
* タイトルページ
* 発表の内容
* 研究の背景
* TCPの限界
* GridFTPの特徴
* 並列データ転送 (1)
* 並列データ転送 (2)
* 研究の目的
* 自動パラメータ設定機構の設計方針
* 基本的なアイディア (1)
* 基本的なアイディア (2)
* 基本的なアイディア (3)
* 自動パラメータ設定機構の概要
* 3 種類の動作モード
* 1. MI モード
* 2. MI モード + 並列 TCP コネクション数調整機構
* 3. AIMD モード
* シミュレーションによる性能評価
* シミュレーション結果
* まとめと今後の課題
これをもとに、以下のような章構成を作成する。
* はじめに
* データ転送プロトコル GridFTP
* GridFTP の概要
* 並列データ転送
* 自動パラメータ設定機構
* 設計方針
* 基本的なアイディア
* 提案する自動パラメータ設定機構
* シミュレーションによる性能評価
* まとめと今後の課題
どのくらいの単位で章にするか、どのくらいの単位で節にするか、全体のバラ ンスを考えて決める。それぞれの章や、それぞれの節のボリュームが同じくら いになるようにする (ただし、「まとめと今後の課題」は例外)。
それぞれの章や、それぞれの節は、大体同じくらいのボリュームのはずなので、 章タイトルや節タイトルの長さもだいたい同じにする。
A4・2 コラム・シングルスペースであれば、1 章/1 〜 2 ページくらいが適当。 6 〜 8 ページ程度の原稿なら、5 章くらいまであるのが普通。8 章とかまで あると多すぎる (つまり、章の単位が細かすぎる)。
節は、1 章あたり 2 〜 4 節くらいが適当。6 〜 8 ページ程度の原稿なら、 節はなくても良いくらい。ある章にだけ節があって、他の章には節がないとい うのはおかしい。つまり、以下のような章構成は良くない (3 章にだけ節があ り、他にはない)。
* はじめに
* データ転送プロトコル GridFTP
* 自動パラメータ設定機構
* 設計方針
* 基本的なアイディア
* 提案する自動パラメータ設定機構
* シミュレーションによる性能評価
* まとめと今後の課題
章構成だけ見て、論文のおおよその内容が分かるようにする。なので、以下の ような章構成は良くない (内容がさっぱり分からない)。
* はじめに
* モデル
* 解析
* 評価
* まとめと今後の課題
作成した論文のアウトラインは、レベル 1 の項目がおおよそ段落に相当し、 レベル 2 の項目がその段落で説明したい要点に相当する。論文のアウトライ ンに、説明を補足する言葉を追加して、段落構成を作成する。例えば、以下の ような論文のアウトラインから、
* 研究の目的
- GridFTP の自動パラメータ設定機構の提案
- クライアント側でネットワークの状態を計測
- 並列 TCP コネクション数を動的に調整
- ネットワーク資源を有効に利用
- 自動パラメータ設定機構の有効性を検証
- シミュレーションによる評価
以下のようなドラフトを作成する。
* 研究の目的
- 本稿では、まず、GridFTP の自動パラメータ設定機構を提案する。
- 提案する自動パラメータ設定機構では、制御チャンネル上を交換されるメッセージの応答時間を利用することにより、クライアント側でネットワークの状態を計測する。
- ネットワークの状態に応じて、GridFTP サーバ--クライアント間で用いられる並列 TCP コネクション数を動的に調整する。
- これにより、さまざまなネットワーク環境において、ネットワーク資源の有効利用を図る。
- また、自動パラメータ設定機構の有効性を、シミュレーション実験により検証する。
上記の例では、論理展開の補足 (「まず」、「これにより」) や、範囲の限定 (「本稿では」、「さまざまなネットワーク環境において」)、手段の明示 (「制御チャンネル上を……利用することにより」、「シミュレーション実験 により」)などを追加している。
ここでポイントとなるのは、接続詞や副詞句等を追加するだけで、論文のアウ トラインの文章の要旨を変えない、ということである。例えば、
- クライアント側でネットワークの状態を計測
という項目を、以下のように変更しても要旨は変わっていない (括弧は追加し た箇所)。
- (提案する自動パラメータ設定機構では、制御チャンネル上を交換されるメッセージの応答時間を利用することにより、)クライアント側でネットワークの状態を計測(する。)
しかし、以下のように書き換えた場合には、もとの要旨と変わってしまってい るからダメ (「ロバストな制御を可能とする」という主旨の文になってしまっ ている)。
- (提案する自動パラメータ設定機構では、)クライアント側でネットワークの状態を計測(することにより、ロバストな制御を可能とする。)
最後に、論文のドラフトを文章に直す。文と文のつながりが自然になるように、 適宜言葉を追加する。基本的には単純作業である。
以下のようなドラフトの場合は、
* 研究の目的
- 本稿では、まず、GridFTP の自動パラメータ設定機構を提案する。
- 提案する自動パラメータ設定機構では、制御チャンネル上を交換されるメッセージの応答時間を利用することにより、クライアント側でネットワークの状態を計測する。
- ネットワークの状態に応じて、GridFTP サーバ--クライアント間で用いられる並列 TCP コネクション数を動的に調整する。
- これにより、さまざまなネットワーク環境において、ネットワーク資源の有効利用を図る。
- 本稿では、また、自動パラメータ設定機構の有効性を、シミュレーション実験により検証する。
以下のように文章に直す。
本稿では、まず、GridFTP の自動パラメータ設定機構を提案する。提案する自
動パラメータ設定機構では、制御チャンネル上を交換されるメッセージの応答
時間を利用することにより、クライアント側でネットワークの状態を計測する。
ネットワークの状態に応じて、GridFTP サーバ--クライアント間で用いられる
並列 TCP コネクション数を動的に調整する。これにより、さまざまなネット
ワーク環境において、ネットワーク資源の有効利用を図る。
本稿では、また、自動パラメータ設定機構の有効性を、シミュレーション実験
により検証する。