「2021年 保険モニタリングレポート」をWordCloudで可視化してみる

金融庁から「2021年保険モニタリングレポート」が公表されました。

人口減少、技術革新、低金利、顧客ニーズの変化、気候変動などの外部環境を背景に、金融庁が提示する保険会社の課題は以下の6つ。

  • 持続可能なビジネスモデルの構築
  • グループガバナンスの高度化
  • 自然災害の多様化・激甚化への対応
  • 財務の健全性の確保
  • 顧客本位の業務運営
  • 少額短期保険業者の態勢整備

2021年保険モニタリングレポートのWordCloud

このwordcloudは、以下のコードで作成されたものです。

import numpy as np
import re
from janome.tokenizer import Tokenizer
from tika import parser
from wordcloud import WordCloud

file_data = parser.from_file("210910.pdf") # ダウンロードしたレポートを読み込み
text = file_data["content"].replace('\n','')

def get_word_str(text):

    t = Tokenizer()
    token = t.tokenize(text)
    word_list = []
 
    for line in token:
        tmp = re.split('\t|,', str(line))
        # 名詞のみ対象
        if tmp[1] in ["名詞"]:
            # さらに絞り込み
            if tmp[2] in ["一般", "固有名詞"]:
                word_list.append(tmp[0])
 
    return " " . join(word_list)

word_str = get_word_str(text)

wc = WordCloud(font_path=r'C:\Windows\Fonts\msgothic.ttc'
               , max_font_size=70
               , min_font_size=10
               , width=800
               , height = 400
               , background_color="white").generate(word_str)
wc.to_file("ins_monitoring.png")