「2021年 保険モニタリングレポート」をWordCloudで可視化してみる
金融庁から「2021年保険モニタリングレポート」が公表されました。
人口減少、技術革新、低金利、顧客ニーズの変化、気候変動などの外部環境を背景に、金融庁が提示する保険会社の課題は以下の6つ。
- 持続可能なビジネスモデルの構築
- グループガバナンスの高度化
- 自然災害の多様化・激甚化への対応
- 財務の健全性の確保
- 顧客本位の業務運営
- 少額短期保険業者の態勢整備
2021年保険モニタリングレポートのWordCloud
このwordcloudは、以下のコードで作成されたものです。
import numpy as np
import re
from janome.tokenizer import Tokenizer
from tika import parser
from wordcloud import WordCloud
file_data = parser.from_file("210910.pdf") # ダウンロードしたレポートを読み込み
text = file_data["content"].replace('\n','')
def get_word_str(text):
t = Tokenizer()
token = t.tokenize(text)
word_list = []
for line in token:
tmp = re.split('\t|,', str(line))
# 名詞のみ対象
if tmp[1] in ["名詞"]:
# さらに絞り込み
if tmp[2] in ["一般", "固有名詞"]:
word_list.append(tmp[0])
return " " . join(word_list)
word_str = get_word_str(text)
wc = WordCloud(font_path=r'C:\Windows\Fonts\msgothic.ttc'
, max_font_size=70
, min_font_size=10
, width=800
, height = 400
, background_color="white").generate(word_str)
wc.to_file("ins_monitoring.png")