1.はじめに
物件に住んだ方が居住環境について口コミを投稿できるサイトが増えています。お引越しの際など、参考にされた方もいらっしゃるのではないでしょうか。以前から、不動産市場は売り手と買い手で把握できる物件の情報に差があり、適切な取引が行われていない事が問題視されてきました[1]。こうした口コミサイトは売り手と買い手の情報格差を埋める鍵となる可能性があります。しかし口コミの数は膨大であり、買い手が全てに目を通すことは難しいことから、物件の口コミ情報が十分に活用されているとは言えません。
そこで今回は試みとして、投稿された大量の口コミをコンピューターによって分析していきます。そして実際のまちなみと比較することで、居住者がどのような点を評価しているか考察してみます。
2.分析方法
図1の流れで分析していきます。口コミデータは、マンションレビューという口コミサイトで閲覧できるオープンデータを使用しました。マンションレビューは、分譲マンションや賃貸物件の価格相場・販売履歴・賃料履歴、ランキング、口コミ・評判を情報提供する総合マンション情報サイトです[2]。対象地は物件データ数が最も多い世田谷区としました。
まず、世田谷区の物件について、周辺環境に関する口コミデータを取得します。文章の分析には、人の書いた文章を機械で処理して内容を読み取る自然言語処理の技術を用い、tf-idf値という指標を使って行います。このtf-idf値は、文書中に含まれる各単語が「その文書内でどれくらい重要か」を表す尺度で、単語のtf-idf値が高いほど、その単語は文書のキーワードであることを示します。次に、町丁別にtf-idf値が高い特徴的な単語を抽出し、口コミの傾向にもとづいて町丁をいくつかの地域に類型化します。最後に、類型化した地域の口コミの傾向と、実際に計測したまちの物的環境とを比較し、その結果について考察を行います。
図1:分析の流れ
3.口コミデータの概要
世田谷区におけるマンション名、住所、築年数、推定相場㎡単価、戸数を含む有効データ2179件から周辺環境に関する口コミデータを725件取得しました。図2は口コミを取得した物件の分布を示した地図となります。
図2:物件分布状況
次に、先述の自然言語処理を用い、口コミデータの文章725件に対して分析を行いました。tf-idf値を算出し、tf-idf値の高い上位30位の単語から、居住者の感情を表す単語と物的環境に関する単語を15単語抽出しました。抽出した15単語のtf-idf値を用いて、世田谷区の全67町を3つの地域に類型化しました。
4.口コミから推定した3つの地域類型
類型化した3つの地域類型について、tf-idf値からそれぞれの地域の口コミの特徴を分析してみました。1つ目は、「公園」「緑」「静か」という単語がキーワードであり、「商業」に関する単語が少ないグループです。このグループは自然豊かな一方、お店が少ないと考えられるため、「郊外住宅地域」と名付けました。それに対して2つ目は、「便利」「コンビニ」がキーワードであり、「自然」に関する単語が少ないグループです。こちらは駅前など利便性の高い市街地だと考えられるため、「商業利便地域」と名付けました。3つ目は、全体的にどの単語のtf-idf値も高く、バランス良くとっているグループです。こちらは自然環境と商業が両立していそう混在している「両立地域」と名付けました。
これらの地域類型の分布状況を地図上に表現した結果、いくつかの特徴を把握することができました。図3のように「商業利便地域」は、都心に向かう路線に沿って分布する傾向があります。「郊外住宅地域」は、その隙間に分布しており、「両立地域」は空間的な集塊はないように見えています。
図3:口コミによる地域類型の分布
5.口コミと物的環境の比較
次に、口コミの傾向と、実際の物件周辺の物的環境を比較してみたいと思います。今回は地理情報に関するオープンデータ[3]を用いて、物件から最寄り駅までの直線距離、周囲800m圏の面積あたりの公園数(以下、公園密度)、周囲800m圏の商業系の用途地域の面積割合(以下、商業用地地域割合)の3つの指標を、町丁別に平均する事で物的環境を算出しました[注1]。図4、5、6は各指標の空間分布を地図で示しています。
3つの地域類型について、物的環境の指標を平均した結果を表1に示します。こちらから2点、興味深い結果が得られました。1点目は、郊外住宅地域と他の地域の違いです。郊外住宅地域は最寄り駅から遠く、商業系の用途地域や公園が少ない地域である事が分かりました。このうち、駅と商業は口コミの傾向と合致する結果です。しかし公園密度については、郊外住宅地域は「公園」「緑」に関する口コミが多いにも関わらず、実際の公園は少ないという結果となりました。2点目は、商業利便地域と両立地域に物的環境の違いが見られない事です。同じような物的環境にも関わらず、口コミの傾向が異なる結果となりました。
実際にまちなみを見る事で、この結果の理由を考えてみます。
まず、郊外住宅地域で公園の密度が少ない地域(例:代沢、粕谷)を見ると、大きな公園が近い事が分かりました(例:粕谷にある蘆花恒春園)。実際に、居住者の利用に供する事を目的に作られた小規模な街区公園[4]を除いて公園密度を算出すると、表2の通り郊外住宅地域が最も高い値となりました。小さな公園が多く存在する事よりも、大きな自然資源が近隣にある事で、居住者にとって期待以上に緑や公園の存在を感じられるのだと考えられます。
次に、両立地域で商業割合が多いにも関わらず、「静か」がキーワードとなった地域(例:桜新町・三宿・喜多見)を見ると、地域内に幹線道路が通っていない事が分かりました。また筆者の主観ではありますが、どの街も地元の方向けのお店が多い印象を受けました。たとえば、桜新町のまちづくり協定では「地域社会・住民の生活に密着した商店街」が方針とされており[5]、地元に密着した商店街を目指している事が伺えます。地域を通過する自動車の少なさや、来街者より居住者向けのお店がある事も、居住者にとって期待以上に利便性と静かさが両立した地域であると感じさせる可能性があります。
図4:最寄り駅までの平均直線距離
図5:周囲の公園の平均密度
図6:商業系用途地域の平均割合
6.おわりに
今回は自然言語処理の技術を用い、物件の口コミを分析しました。居住者が周辺環境に感じる事にバリエーションがある事、それは物的環境と相関するとは限らない事が分かりました。
今回は物件の周辺環境について述べた口コミ情報のみを用いましたが、物件の設備や室内環境に関する口コミも多く寄せられています。自然言語処理の技術の発展に伴い、今後さらに口コミが活用されて行くことが望まれます。
7.参考文献
[1] 高橋孝明. 都市経済学. 有斐閣ブックス, 2012, p266-269.
[2] マンションレビュー, https://www.mansion-review.jp/ (最終閲覧日:2022-09-26)
[3] 国土交通省, 国土数値情報ダウンロードサービス.
[4] 国土交通省, 都市公園の種類. https://www.mlit.go.jp/crd/park/shisaku/p_toshi/syurui/(最終閲覧日:2022-09-23)
[5] 桜新町街づくり協議会, 桜新町街づくり協定, 2014.
[注1] 800m圏の設定にあたっては、各物件を中心点とする半径800mの円を描き、内部の密度・割合を計算しました。物件の口コミ情報が無かった世田谷区駒沢公園、砧公園の両町については、町の重心点から最寄り駅までの直線距離と、重心点800m圏の公園密度、商業用途地域割合を算出しました。
文責:陽飛楽、森田洋史