Quantcast
Channel: 円周率近似値の日に生まれて理系じゃないわけないだろ! - knifeのblog
Viewing all articles
Browse latest Browse all 5376

ローマ字変換の違い

$
0
0



Google検索にて、

"グアテマラ" 約 956,000 件
"グァテマラ" 約 398,000 件
"ガテマラ" 約 237,000 件

など、Guatemalaのカタカナ表記などの件数の違いなどが見て取れる。

「ぐぁ」なんて滅多に入力しないかもしれないが、需要がないわけではない。


私はパソコンに携わって、かれこれ30年近くになるが、日本語変換はローマ字変換を利用し続けている。

現在のパソコンには、MS-IME、ATOK、Google日本語入力、と3つのIMEをインストールしている。

というわけで、これら3つのIMEで、ローマ字変換に違いがあるのかを確認してみることにした。


【五十音】


aiueoMS-IMEATOKGoogle

k
s
t
n
h
m
y
いぇ
r
wうぃうぇ

【濁音・半濁音】

aiueoMS-IMEATOKGoogle
g
z
d
b
p

【拗音のみ】

aiueoMS-IMEATOKGoogle
l
x
lk


xk


lt



lts



xt



xts



ly
xy
lw



xw




ここまでは、どのIMEにも違いは見られないというか、これが基本なのだろう。

【ア行拗音・ウ段】

aiueoMS-IMEATOKGoogle
whうぁうぃうぇうぉ
qくぁくぃくぇくぉ
kwくぁくぃくぅくぇくぉ
qwくぁくぃくぅくぇくぉ

swすぁすぃすぅすぇすぉ××
tsつぁつぃつぇつぉ
n?ぬぁぬぃぬぅぬぇぬぉ×××
fふぁふぃふぇふぉ
fwふぁふぃふぅふぇふぉ××
hwふぁふぃ
ふぇふぉ××
m?むぁむぃむぅむぇむぉ×××
y?ゆぁゆぃゆぅゆぇゆぉ×××
r?るぁるぃるぅるぇるぉ×××
vヴぁヴぃヴぇヴぉ
う゛ぁう゛ぃう゛う゛ぇう゛ぉ
gwぐぁぐぃぐぅぐぇぐぉ
z?ずぁずぃずぅずぇずぉ×××
d?づぁづぃづぅづぇづぉ×××
b?ぶぁぶぃぶぅぶぇぶぉ×××
p?ぷぁぷぃぷぅぷぇぷぉ×××

【ア行拗音・オ段】

aiueoMS-IMEATOKGoogle
?おぁおぃおぅおぇおぉ×××
k?こぁこぃこぅこぇこぉ×××
s?そぁそぃそぅそぇそぉ×××
twとぁとぃとぅとぇとぉ×
n?のぁのぃのぅのぇのぉ×××
h?ほぁほぃほぅほぇほぉ×××
m?もぁもぃもぅもぇもぉ×××
y?よぁよぃよぅよぇよぉ×××
r?ろぁろぃろぅろぇろぉ×××
g?ごぁごぃごぅごぇごぉ×××
z?ぞぁぞぃぞぅぞぇぞぉ×××
dwどぁどぃどぅどぇどぉ×
b?ぼぁぼぃぼぅぼぇぼぉ×××
p?ぽぁぽぃぽぅぽぇぽぉ×××


【ヤ行拗音・イ段】

aiueoMS-IMEATOKGoogle
?いゃいぃいゅいぇいょ???
y(や)(い)(ゆ)いぇ(よ)
kyきゃきぃきゅきぇきょ
syしゃしぃしゅしぇしょ
shしゃ[し]しゅしぇしょ
tyちゃちぃちゅちぇちょ
cyちゃちぃちゅちぇちょ
chちゃ[ち]ちゅちぇちょ
nyにゃにぃにゅにぇにょ
hyひゃひぃひゅひぇひょ
myみゃみぃみゅみぇみょ
ryりゃりぃりゅりぇりょ
gyぎゃぎぃぎゅぎぇぎょ
jじゃ[じ]じゅじぇじょ
jyじゃじぃじゅじぇじょ
zyじゃじぃじゅじぇじょ
dyぢゃぢぃぢゅぢぇぢょ
byびゃびぃびゅびぇびょ
pyぴゃぴぃぴゅぴぇぴょ

【ヤ行拗音・ウ段】

aiueoMS-IMEATOKGoogle
?うゃうぃうぅうぇうょ×××
w(わ)うぃ(う)うぇ(を)
qyくゃくぃくぅくぇくょ×
s?すゃすぃすぅすぇすょ×××
t?つゃつぃつぅつぇつょ×××
n?ぬゃぬぃぬぅぬぇぬょ×××
fyふゃふぃふゅふぇふょ
ふゃ
ふゅ
ふょ

?むゃむぃむぅむぇむょ×××
?るゃるぃるぅるぇるょ×××
vyヴゃヴぃヴゅヴぇヴょ×
g?ぐゃぐぃぐぅぐぇぐょ×××
z?ずゃずぃずぅずぇずょ×××
d?づゃづぃづぅづぇづょ×××
b?ぶゃぶぃぶぅぶぇぶょ×××
p?ぷゃぷぃぷぅぷぇぷょ×××

【ヤ行拗音・エ段】

aiueoMS-IMEATOKGoogle
?えゃえぃえゅえぇえょ×××
k?けゃけぃけゅけぇけょ×××
s?せゃせぃせゅせぇせょ×××
thてゃてぃてゅてぇてょ
n?ねゃねぃねゅねぇねょ×××
h?へゃへぃへゅへぇへょ×××
m?めゃめぃめゅめぇめょ×××
r?れゃれぃれゅれぇれょ×××
g?げゃげぃげゅげぇげょ×××
z?ぜゃぜぃぜゅぜぇぜょ×××
dhでゃでぃでゅでぇでょ
b?べゃべぃべゅべぇべょ×××
p?ぺゃぺぃぺゅぺぇぺょ×××

【その他】

aiueoMS-IMEATOKGoogle
c×
wy



○は入力可能
△は上方向の別の入力で可能
▽は下方向の別の入力で可能
□は別の入力で変換可能
×は、この組み合わせでは入力不可能


誰でもが出来るだけ打鍵数を少なく入力したいと考えるだろう。

一番のネックは拗音だけを入力するようなことで、前後の文字と組み合わて打つことが最良である。

子音の1文字目に使ったのは、
b, c, d, f, g, h, j, k, m, n, p, q, r, s, t, v, w, y, z
の19文字

子音の2文字目に使ったのは、
h, s, w, y
の4文字

子音の1文字目と2文字目が揃うことは「っ」になるため、
2文字子音では、
19×4-4=72
の子音を形成できるが、全てが割り振られているわけではない。


bcdfghjkmnpqrstvwyz
hbhchdhfhgh-jhkhmhnhphqhrhshthvhwhyhzh
sbscsdsfsgshsjsksmsnspsqsrs-tsvswsyszs
wbwcwdwfwgwhwjwkwmwnwpwqwrwswtwvw-ywzw
ybycydyfygyhyjykymynypyqyrysytyvywy-zy

青部分は何らかのIMEに割り振られていて、白部分は割り振られていない。

例えば、割り振られていないところに、何らかの音を割り振っても良いのではないだろうか。


子音2文字目のwに着目すると、このwはア行の拗音として利用されているが、発音としてはワ行の拗音に近いものではないだろうか。

例えば、


aiueo
kwくぁくぃくぅくぇくぉ
gwぐぁぐぃぐぅぐぇぐぉ


aiueo
twとぁとぃとぅとぇとぉ
dwどぁどぃどぅどぇどぉ

とあるので、


aiueo
swすぁすぃすぅすぇすぉ
zwずぁずぃずぅずぇずぉ

の様にswに濁点を付けるという意味で、zwを割り振っても良いのかもしれません。


例えば、発音に重きを置くとタ行やダ行は、


aiueo
t?てぃとぅとょ
d?でぃどぅどょ

に近いかなと感じ、五十音と異なる部分が出てくる。

ヘボン式として、ち=chi、つ=tsuなど別の子音を割り振っていることからも、外国人にはタ行に違和感があったのだろう。


aiueo
t
chちゃちゅちぇちょ
cyちゃちぃちゅちぇちょ
tsつぁつぃつぇつぉ
thてゃてぃてゅてぇてょ
d

?ぢゃぢゅぢぇぢょ
dyぢゃぢぃぢゅぢぇぢょ
dsづぁづぃづぇづぉ
dhでゃでぃでゅでぇでょ

のようになり、づぁ行がないので、dsを割り当てても良いのではないだろうか。

しかし、つぅ、づぅという音がどこにも割り当てられていない。

てょ、でょ、は字面としてはありなのかもしれないが、音としては伴っていないような気がする。


例えば、子音cにおいては「かしくせこ」というものがあるのだから、五十音の字面にこだわることもないのかもしれない。

cがあることで、IMEがONの状態で、英単語として「america」と入力したとしても、「アメリカ」と表示される。

当然だが、「amerika」と入力しても、「アメリカ」と表示され、更に変換で「America」にすることも可能である。

前者は、英語圏の人が日本語を入力することを考えていて、後者は日本人が英語を入力することを考えていることに他ならない。

つまり、日本語変換は日本人だけが使うものではなくなっているのである。


Viewing all articles
Browse latest Browse all 5376

Trending Articles