
ビジネスモデルとしての翻訳ローカリゼーションはまだ浅い。
だが進化速度は速く、それだけ陳腐化も急激に訪れる。
それだけにマーケットはとらえにくく、何よりプレイヤーが疲弊している。
ここでは、ローカリゼーションを巡るビジネスの全体像を展望する。
まず、初回は、状況をリードしてきたシングルバイト「英語」について話しをしよう。
01
左右真彦
Vol.1 Vender Monology
L10Nについて語るために、Byte の話から始めなければならない。
話は、一気に1980年代に遡る。現在時間は2005年夏だ。
KOTOBAⅠ
宿命的に、言語の本質美は、叙事詩から抒情詩へ、そして象徴詩へと昇華する。なぜこのオプションが要るのか。それは人間にとって便利なだけかもしれない。たしかに抽象度が高いほうが発達した言語だし、何より美しい。
これは僕の言葉じゃない。悲しいけれど、僕らは相対性のなかでしか、真実を語れないはずだ。同様に、いつだって最適の引用など存在しない。
1382年、ジョン ウイクリフがラテン語で書かれた聖書をイギリス語へ最初に翻訳したとき、彼はその動機について、チェコ人の英国王后は母国語で聖書を読んでいるのに、国王は母国語であるイギリス語で読むことができない、それを何とかしたいと思ったからだ。
- 聖書の多言語翻訳は1800年もの間、熟成する酒をよそに、ゆったりと浸透し、すでに2,212の言語に聖書が翻訳されているという。現在、世界の自然言語数は6,800余り存在するとして、残り3,700言語を対象に、将来の聖書の多言語化が計画されているようだが、これまでのペースを加速しても1世紀は悠にかかる。もっとも6,800の自然言語のうち半数から9割は今世紀中に消滅するというワシントンの環境シンクタンクの言説と予測を疑ったとしても、このプロジェクトは修正を迫られるだろう。
悠久の時をかけ、信仰が多元語化を巧みに方法論化してきたことは、僕らにとって驚異だ。布教がマーケティングの終点だとしても、そのコスト計算は永遠に噛みあわない。ウイクリフの真心とローカライズの本質がどこかで結合するとしてもだ。
何より言葉は消滅と生成を繰り返している。言葉が意味性より機能性に準拠されることは誰もがわかることだ。僕らは、忠誠によって説明できるローカライズできる手法を知らない。そこへ立ち帰ることのできない地点にいる。
やはり、この殺風景を何とかしたいと思っているのだ。
でもちょっと待てよ。何とかしたいって何だ!
インターネットが出現させたいくつかの出来事で僕らが信じ切れるのは、僕らの風景を徹底的に変えたことだろう。そのとき、それまでの風景画が退屈でしかなかったというのは理由にならない。
たしかに、僕らは、同じ風景と数字を共有していることの方が話は簡単だ。もっと風景を微細に抽出してみよう。
現在、その言葉は、約3億8千万人もの人々に母国語として話されている。そして、その3分の2の2億5千万人が第2言語として使用し、10億人が外国語として学習し、61億人を超える世界人口の3分の1、つまり約20億以上の人間が、何らかの形でアクセスしている。人口増加率が1.2%だと仮定して年7,700万人が増加する。このとき2050年には世界の約半数が利用することになる。
羞恥心をもって告白するけれど、僕らは、英語を世界中のいたるところで濫用し、身体のどこかでこの言葉を許し切っている。上のパズルで何らかの形でというのはとても暗示的なのであり、僕らはすでに英語をコミュニケーションの手段としてのみ利用してはいない。
- 英国調査会社によれば、2050年の世界人口における推定使用言語は、日常言語として話す人々は中国語が1位、英語はヒンディー語に抜かれて3位に転落する。だが影響力という点では、英語、ドイツ語、フランス語、日本語、スペイン語の順だ。統計には陳腐な裏があるし、たいていの予測は外れるものと知っていても、この調査概要には分からないことがある。言語の影響力といい、国際的地位といい、これはいったい何だろう。2050年、それは相対性を力学として維持できるのか。
荒唐無稽のオペラ、それは18世紀にスクロールされたノイズだ。
KOTOBAⅡ
そもそも言語自体は異質な他言語間で本能的に反応し合うと考えてよい。フランスやドイツ、ポーランドのように、母国語の英語化による侵食を防ぐため国家が法律を制定していたとしても、異質な言葉同士の自律的な化学反応を防ぐことはできない。
そして、勢力の拡大と共に進化し、ロマンス諸語、ケルト語、ゲルマン語、ノルド語をはじめ、多彩な言語と文化を背負う英語は、浸食作用も同化機能も強く、新語に対する抵抗観も少ない。変幻自在の安易さが力の源泉なのであって、インターネットやコンピュータ、携帯電話などは、英語のためにあるようなもので新しい言葉を連射しつづける。イージーでポップで、いたずら好きなのだ。ちなみに、タイトルのL10Nというのは業界で流通するLocalizationを指す言葉の遊びだ。
- 日本語の場合には、他言語間との反応とはまた異なる次元で、日本語内部における絶妙な異化作用を発生させる特質をもつ。漢字、ひらがなとカタカナ、ローマ字を自由に操る東洋人を友人のスコットランド人は奇異な目で眺めることがある。日本語は、表記、表現上、無数の変換を可能にし、多様な文体を内在化する。この日本語の構造的な特質性に依拠する多義性、機能性は、ローカリゼーションの工程および訳文の品質において致命的な差異を引き起こす。
イギリスであれ、アメリカであれ、英語の世界覇権は、これを公用語とする列強の継続的権力の支配によってその国際的地位とともに築かれてきたとする学説は言い得ているとしても、経済のグローバル化(なんて陳腐な言葉だろう!)と重奏し、ソフトウェア/ハードウェア開発と一体化して奏でられるL10Nの調律を理解する場合には、むしろ邪魔かもしれない。
もう少し英語について知ろう。なぜ、この言葉がL10Nの中心に存在しているのか。同化以上に自生的に異化機能が豊かな言語だとされる言の葉に宿る言霊としての日本語が、なぜL10Nの主役に成りえず、言語ユーザの支配を勝ち取ることが難しいのか。
Internet
季節が移動している。
2005年の8月は35度を超す日が観測史上最多を数えた。
猛暑の連続だったこの1ヶ月間、自宅でインターネットを利用する人々は過去最高の2,600万人を超えた。接続時間は平均11時間11分35秒。自宅での潜在利用者は6,114万人と見積もられている。一方、職場での利用者はそれぞれ839万人、潜在者1,050万人である。2001年11月時点での月間ネット利用人口は1,996万だから、9ヶ月間で、1.32倍増加していることになる。
- 白書はネット利用者数について2005年末で7,670万人に達すると予測した。政府の調査では、2001年末、ネット利用者数は前年比885万人増の5,593万人、人口普及率は6.9ポイント増の44.0%、自宅での普及率は前年比60.5%で26.5ポイントを押し上げた。企業普及率は1.8ポイント増の97.6%でほぼ100%となった。個人のネット利用ではパソコンからが4,890万人で、携帯電話、PHS、携帯情報端末からが2,504万人だ。
- 民間のデータと若干差があるけれど、要するに、インターネットは冷蔵庫や電子レンジのように気軽に開けられ、テレビのリモコン操作以上に親和に使われていることを物語る。
そう、僕らは、冷蔵庫を開ける以上に、ブラウザのボタンが気に掛かる。
携帯電話のベルに敏感だ。
自然言語としての英語はすでに中国語に圧倒され、やがてヒンディ語に追われるとしても、ネット人口では4割を誇示する巨大言語だ。
- 今年3月の言語別世界ネット利用者は、英語40.2%、中国語9.8%、日本語9.2%、スペイン語7.2%、独逸語6.8%、韓国語4.4%、フランス語3.9%、イタリア語3.6%、ポルトガル語2.6%、オランダ語2.1%、ロシア語2.0%と続く。
- 世界ネット人口は5億6千万人として、英語圏は2億3千万人、非英語圏は59.8%で3億4千万人、英語以外のヨーロッパ言語は33.9%で1億9千万人、アジア言語は26.1%の1億5千万人である。
- 今後、中国語はサイバーでも増大し、日本語はつらつらと横ばいする。
- http://www.glreach.com/globstats/index.php3
ところが、サイバー世界では62%~87%が英語表記で行なわれているという前提がある。ということは世界言語全体の7%に満たない英語を母国語とする人々が、ネット全体の約40%を占める英語圏のネットユーザによって、サイバー全体の9割に上る量が書き込まれ、入力され、発信されているということになる。これは言語によるアクセス占拠だ。
ということは、ソフトウェア/ハードウェア アプリケーションやインターネットの約6割から9割が英語で表現され、同様にL10Nにおいては、約6割から9割の翻訳ターゲット文書は英語で記述されている、と解釈するのは乱暴な推論ではない。
英語の集中化は、他言語のサイバー活動が今後活発化されることによって緩和され、英語圏の比重は相対的には低下するはずだが、L10Nの世界からすれば、ビジネス上、独占だと言ってもいい。
- L10Nでは、翻訳ターゲットファイルの量的受注額は勿論、単価設定における単位、コンテンツの構成、翻訳の仕様、技術にいたるまで、英語を基準にすべてが回っているといってよい。言語変換でも、たとえば英語から日本語、日本語から英語、英語から中国語、英語からフランス語などと、英語を起点としては翻訳が発生する。一度、日本語を英語にローカライズされたマニュアル文書について、スペイン語やフランス語や独逸語などの複数言語によるバージョンアップ版を作成する際、英語バージョンを元にローカライズのに、英語で記述されたスペックに従って多言語化し、DTP作業を日本でアウトソースし、出力印刷は韓国で行なうなど、よくある話しだ。
僕らの願いはインターネットの増殖性にあり、本能的に多言語化する傾向を好意的に受け止めている。Windowesミレニアムは28ヵ国語バージョンですでに発売されているじゃないか。
ネット利用者は総国内人口の約40%とされる米国に対し、アジアは1.6%だ。たしかにネット利用が拡大しているのは非英語圏であり、とくにアジアは急増する。2003年には非英語圏でのネット利用者数は5億1万人に達し、英語利用者数は2億7千万人と推定されている。しかし、その2億7千万人の利用者たちが目にするのは6割から9割が英語表記によるものだとしたら、そのとき僕らの願いとは何なのだろう。
少なくともビジネスは9割と1割のコンバージョンを自動的に志向するのであって、1割における少数言語間の変換に収益構造化を図ろうとするのはグロテスクだ。英語の重要性は揺らがない。
Localization
ローカリゼーションは言うまでもなくカタカナ日本語への転用であって本来はLocalizationと記述する。LocalizationはTranslationと同義と捉える人々はネイティブに非常に多いが、僕らの世界では完全に異なる機能として用いている。なお、社会科学系で使用される「分権化」の概念とは区別しておきたい。
じつは今なお、Localizationに定着した訳語があるわけではない。「地域化」「現地化」と訳出された時期もあったが、今では「現地仕様化」などと訳すことが多い。でもこれはダサいと感じてしまうので僕などはあまり使用しない。「文化適応化」というのもあるが、それなら「仕様最適化」と記した方が背景を捕まえている。極めて企業の戦略性に裏付けされたアプローチだからだ。
Localizationの訳語としての取扱いを例に見るまでもなく、L10Nの世界では、新語や新しい概念に対して、一時的に、仮の言葉を継ぎ接ぎして訳文を作成させる場面が多い。
- L10Nの定義もいくつもある。多くはベンダー自身がクライアント向けに分かりやすく説明する場合に考案したもので、学説や通説として定着した概念ではない。
- たとえばProgrammingを変更するテクニカル ローカリゼーションとWritingやTranslationを中心するリテラル ローカリゼーションとに分ける考えだ。テクニカル ローカリゼーションはクライアントが担当し、ベンダーによるリテラル ローカリゼーショ
- ンに先行して実行される。またグローバリゼーションは、L10Nとインターナショナリゼーションの2つの要素から構成されると理論化しているものもある。
このようなとりあえずの変換作業においては、適訳がないと判断されるとカタカナで「ローカリゼーション」と書き記してしまう。その際、気を使うのは、果たして「ローカリゼーション」と表記するのか、「ローカライゼーション」とするのかといったようなことだ。発音学に必ずしも秀でていない多くの翻訳者は、日本語特有の同化性と柔軟性に頼ってしまい、文中にLocalizationと埋め込んでしまう技を行使する。これは職人気質で翻訳を生業にしている側からすると邪道で禁じ手ではある。傾向として、翻訳者はこの技を巧みに駆使し、翻訳家は言説をもって躊躇する。
- とりあえず変換された訳語は安定するまで寝かされる。その間、訳語自身が変化したり、取り替えられたりする。そこまで待って使用するのがよいのだが、市場はそれを許容しない。それに時代が追いついて、熟成されたと感じられる頃には、また新しい新語が洪水のように襲ってくるのであって、とりあえずの作業は循環している。このこともあり、技術者や研究者たちは、翻訳文に頼らず、原文をそのまま解読していることが多い。
- 例をもうひとつ。自戒の意味を込めて、僕が、とてもいやだなあと思うのは次のような文章だ。
- 「近年の急速なITの進化を背景として、経営・資本のグローバル化が進展するとともに、スピード、コストに対するクライアントからのニーズが高まっている。
- ニーズの充足とイノベーションとしてのプロダクツやサービスの開発にフォーカスするために、従来型の経営パラダイムの変革が急務だ。L10Nにおいても、これまでのセントラライゼーションをコアとしたコマンド&コントロールのビジネスモデルは、もはやクライアントが期待するスピードやコスト配分を充足できなくなった。
- 今後は、コアコンピタンスに資本を集中させ、バリューチェーンにおけるノンコア活動に関するキャパシティをアウトソーシングに求め、現地法人などの物的資本への依存度を減少させるため、コラボレーションによるオープン型経営スタイルへと変化せざるを得ない。新しいローカリゼーションでは、コラボレーションによるソリューションと、協業を可能にする構造化・標準化をサポートするワークプレイスを提供する。このような標準的な文体は原文英語を翻訳し、それを練り直したものと直感できる。」
- ローカライズでは、ひらがな4割、カタカナ3割、漢字2割、英数字1割が、洗練されていてユーザにはウケルのだ。
いずれにせよ、Localizationは依然として定着していない新規の概念で、辞書に掲載されるのはまだ先のことだ。それはビジネスとしてのL10N産業そのものが揺籃期にあることを示している。概念は未熟で、業界も成長過程とあるとするならば、僕らはまずその機能性についてまず見定めることが必要だろう。
機能性はマーケットのニーズに準拠されて定立するが、L10Nの主たる要求は、ソフトウェアやハードウェアのアプリケーションをマーケットに投入する際に多く発生する。アプリケーションの市場への投入は、製品による市場の占拠化、標準化を至上命題とするから、MicrosoftのWindowsのように、広く、薄く、一気に、突然と、実行される。このことはL10Nのアプローチと同じ発想だ。L10Nもまた、全世界的に、容易に、標準化し、短納期とスピードによって秘密裏に行なわれる。
- 一気に、突然と、というのは、後ほど述べる、米国を中心とした多国籍企業の技術戦略、とくにR&D、特許戦略の影響だし、また、薄くというのは、L10Nがデジタル性に基づく変換作業であり、そのデジタル性に影響される特別な制約があることを示唆している。
Byte
従来の翻訳とL10Nの機能上の決定的な差異は、翻訳が周波数や活字などで表出されうるアナログ状の自然言語を変換する行為であるのに対し、L10Nはデジタル性を内包する記号や信号を媒介として自然言語を変換させる作業であることだ。
コンピュータの父はジョン フォイ ノイマンではなく、ジョン モークリーとプレスパー エッカートであるという説は、その発明した機械が基本的に数字しか取り扱うことができないという事実からすれば、たいした問題ではないかもしれない。
コンピュータ上での文字や記号は、それぞれに数値が割り振られることで取り扱いが可能となる。
そのあたりの変遷については次回話をするとして、コンピュータで稼動する際の自然言語の表出には2通りの振る舞いがある。シングルバイトとダブルバイトだ。これは、1つの言語で使われる文字が256種(1バイト)より多いか少ないかで類型化されている。世界のほとんどの言語はシングルバイトで表示できる。
しかし、中国語(簡体字・繁体字)、朝鮮語(漢字・ハングル)、日本語(漢字、ひらがな、全角カタカナ)、ベトナム語(共産化以前北部で北部で用いられていた漢字だ)については1文字を表すのにダブルバイトが必要となる。
- 英文字26文字で、数字や記号を入れたとしても、7つの電気信号(2の7乗=128種類の区別)があれば英文字を表現できる。日本語は、一般にコンピュータ上ではJISコード(6353文字)を使用する。1文字を表すのに電気信号が13(2の13乗=8192)必要となる。コンピュータは8つの信号(8ビットまたは1バイトとも言う)を同時処理するので、英語は8つ1組(1バイト)で1つ表せるが、日本語はこの8つの電気信号二組(2バイト)を使わないと一つの文字を表すことができない。
主に英語圏で進化してきたコンピュータはシングルバイト(7/8ビット)対応を基本単位として扱う前提で作られている。このためダブルバイト対応ではいろいろな制約が生じる。とくに、インターネットを通じて様々な環境の情報を交換する際、思わぬ問題に遭遇することになる。
いずれにせよ、そもそもシングルバイト対応のコンピュータが英語によってリードされてきたのは当然であって、英語がインターネットで主導権を独占する理由も、コンピュータを介在させて実行されるL10Nにおいてなお隠然と輝ける影響力を行使し続ける由来もここにある。英語はコンピュータの文字表出機能において絶対的な優位さを維持する。そしてこの2通りの振る舞いの相違は、先にみた英語と非英語の自然言語の実数とサイバー上での書き込み量の比率の不思議さに通じるものである。
Digital
くどいようだが、翻訳の世界は自然言語間のアナログ変換であるが、L10Nの世界は、自然言語のデジタル変換である。この変換では機械言語を生成するプログラミング言語を内包している。したがって、電子の世界で翻訳を行なうL10Nは、そのデジタル性が保持する本質に決定的に影響を受けることになる。
デジタル性はコストゼロへのあくなき執着だ。このアプローチは米国多国籍企業を中心として発達してきたシングルバイト対応的手法であって、彼らの得意とする世界標準化という世界観で形成されている。そしてそれはとりもなおさず、MLVが採用してきた企業戦略も、このようなシングルバイト的なマネジメントとマーケティング理論に基づくものだ。
- L10Nビジネスは、各国の言語に特化したL10NベンダーをM&Aにより包摂したマルチリンガル ベンダー(MLV)とよばれる多国籍企業によって推進されてきた。これらの企業は、中央からの強力な統制力で一部のシングルリンガルベンダー(SLV)やサブベンダーを系列化させ、フリーランス翻訳者を主に管理、統率し、ファイルの検証やレイアウト、テスティングなどの各プロセスにおいて、リサイクル、UIの編集、ファイル変換など、専用ツールを用いてシステム的にプロセスを遂行する。
- いわゆる、米国多国籍企業の技術戦略は、イノベーションとその技術的成果の管理に大別できる。つまりマーケティングやR&Dを中心とした技術開発戦略と内部化や特許権化を中心とした技術管理戦略である。歴史的には、技術開発戦略と技術管理戦略が交互に循環してきたが、情報通信技術の発展によって、技術開発戦略と技術管理戦略が同時進行し出したという。その新たな技術戦略モデル、オープンR&D戦略と特許ポートフォリオ戦略に基づいて、L10Nのコストとスピード、量的調整が徹底管理される。製品の市場投入時における宿命である。
Noise
この号で僕が言いたい事は次の一行に尽きる。
L10Nとは英語⇔他言語間とのデジタル変換であり、その世界観と技術は、英語あるいは英語圏の構造と文法と発想によって構成されてきた。
僕らの日常は、原則的にディスプレイ上で展開される。翻訳ターゲット文書に記述された原文英語あるいは訳文英語1wordあたりの単価でコストが算出される。その世界には、いまもなお、何とかしたいと思って翻訳を行なう人々も確実に存在していて、その人たちには確実に、異なる領海へ出ていっている。彼らは、「ローカリゼーション」が翻訳であるとは納得していない。単なる辞書的意味の置き換え作業だ。
僕らが対峙するのは見えないものか、消滅するものだ。自然言語であり、プログラミング言語といい、インターネット言語といい、すべて原文から成果物として納品するまで、すべてのプロセスで、一瞬にして消える。翻訳のコラボレーションといっても顔の見えない翻訳者同士が共通のメモリやツールを共有し、同一のファイル上に同意義の訳語を羅列していく。
今のところ、支払われる通貨だけが、感覚的に確かなことと言えなくもない。
そんな世界を危ういと思うか、面白いと思うかは、たぶんその人のセンスだ。多くのフリーランサーにとっては、せめて気休めに、冒頭の言葉に自虐的に頼るしかない。おそらく、この世界は美しいのだと。
1800年にもわたり聖書翻訳プロジェクトをL10Nの原初的試みとして捉えるか、そこではいつも何とかしたい欲望に駈られることになる。この地平でその分けの分からない魅力に変えることは難しい。この殺風景さは、あのデジタルに起因する。
夜、ひとり起きてきて、冷蔵庫からビールを取り出し、栓を抜くという翻訳者に見られる風景は今もある。翻訳という作業が単なる変換としての作業でしかないとしても、やはりこの作業は基本的には孤独な作業に違いない。違うのは翻訳者を取り巻く背景が異なることだ。決定的にノイズが多すぎる。
熱帯夜にキーボードをたたく孤高は、ビールの泡立ちほど希薄でなくとも、脇を泳ぐクレイフィッシュほどの優雅さはない。だが、美しくもはかない出来事としては済まされない、日々行なうこの作業を巡る状況について、明日のベンダーの行方を探ろうとするとき、僕は、次の言葉を残しておこう。
「ひとつ間違いなく言えるのは、シングルバイトじゃないかぎりメインストリームにはなれない。ダブルバイトではフロントエンドプロセッサーを必要とするという一つの例だけでも、シングルバイト圏の人たちより、余分にコンピューターに負荷がかかるから、すべてがシングルバイトからまず立ち上がる。だから、まずはシングルバイトの言語をおさえておいて、それからもし自分が中国のマーケットをやりたいのならばいいと思うけど、やはり英語という原点は絶対だと思う。英語をやらずに中国語をやるというのはあり得ないと思う」
「日本のソフトハウスは、シングルバイトとダブルバイトの差で負けてしまった。メモリを占有する部分をいつも考えてソフトを作らないといけないし、作業工数が全く違う。圧倒的な差だ」
(続く)
