形態素解析を使う その4 igoを使う

2022年2月22日

テスト用のコードは、以下です。

<?php
require_once “Igo.php”;
$igo = new Igo( dirname(__FILE__) .”/ipadic”, “UTF-8”);
$str = “本日は晴天なり。すもももももももものうち”;
$result = $igo->parse($str);
$result2 = $igo->wakati($str);
var_dump($result);
var_dump($result2);

foreach($result as $key){
echo $key->surface;
echo “<br>”;
}
?>

これだけで、以下の内容を得ることができます。

mecabなどより簡単に導入できると思います。

array(12) {
[0]=>
object(Morpheme)#30 (3) {
[“surface”]=>
string(6) “本日”
[“feature”]=>
string(60) “名詞,副詞可能,*,*,*,*,本日,ホンジツ,ホンジツ”
[“start”]=>
int(0)
}
[1]=>
object(Morpheme)#39 (3) {
[“surface”]=>
string(3) “は”
[“feature”]=>
string(36) “助詞,係助詞,*,*,*,*,は,ハ,ワ”
[“start”]=>
int(2)
}
[2]=>
object(Morpheme)#36 (3) {
[“surface”]=>
string(6) “晴天”
[“feature”]=>
string(54) “名詞,一般,*,*,*,*,晴天,セイテン,セイテン”
[“start”]=>
int(3)
}
[3]=>
object(Morpheme)#44 (3) {
[“surface”]=>
string(6) “なり”
[“feature”]=>
string(62) “助動詞,*,*,*,文語・ナリ,基本形,なり,ナリ,ナリ”
[“start”]=>
int(5)
}
[4]=>
object(Morpheme)#51 (3) {
[“surface”]=>
string(3) “。”
[“feature”]=>
string(33) “記号,句点,*,*,*,*,。,。,。”
[“start”]=>
int(7)
}
[5]=>
object(Morpheme)#40 (3) {
[“surface”]=>
string(9) “すもも”
[“feature”]=>
string(51) “名詞,一般,*,*,*,*,すもも,スモモ,スモモ”
[“start”]=>
int(8)
}
[6]=>
object(Morpheme)#32 (3) {
[“surface”]=>
string(3) “も”
[“feature”]=>
string(36) “助詞,係助詞,*,*,*,*,も,モ,モ”
[“start”]=>
int(11)
}
[7]=>
object(Morpheme)#38 (3) {
[“surface”]=>
string(6) “もも”
[“feature”]=>
string(42) “名詞,一般,*,*,*,*,もも,モモ,モモ”
[“start”]=>
int(12)
}
[8]=>
object(Morpheme)#34 (3) {
[“surface”]=>
string(3) “も”
[“feature”]=>
string(36) “助詞,係助詞,*,*,*,*,も,モ,モ”
[“start”]=>
int(14)
}
[9]=>
object(Morpheme)#48 (3) {
[“surface”]=>
string(6) “もも”
[“feature”]=>
string(42) “名詞,一般,*,*,*,*,もも,モモ,モモ”
[“start”]=>
int(15)
}
[10]=>
object(Morpheme)#33 (3) {
[“surface”]=>
string(3) “の”
[“feature”]=>
string(36) “助詞,連体化,*,*,*,*,の,ノ,ノ”
[“start”]=>
int(17)
}
[11]=>
object(Morpheme)#49 (3) {
[“surface”]=>
string(6) “うち”
[“feature”]=>
string(56) “名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ”
[“start”]=>
int(18)
}
}
array(12) {
[0]=>
string(6) “本日”
[1]=>
string(3) “は”
[2]=>
string(6) “晴天”
[3]=>
string(6) “なり”
[4]=>
string(3) “。”
[5]=>
string(9) “すもも”
[6]=>
string(3) “も”
[7]=>
string(6) “もも”
[8]=>
string(3) “も”
[9]=>
string(6) “もも”
[10]=>
string(3) “の”
[11]=>
string(6) “うち”
}
本日

晴天

なり

すもも

もも

もも

うち

未分類

Posted by admin8admin