「2021年 保険モニタリングレポート」をWordCloudで可視化してみる

金融庁から「2021年保険モニタリングレポート」が公表されました。

人口減少、技術革新、低金利、顧客ニーズの変化、気候変動などの外部環境を背景に、金融庁が提示する保険会社の課題は以下の6つ。

  • 持続可能なビジネスモデルの構築
  • グループガバナンスの高度化
  • 自然災害の多様化・激甚化への対応
  • 財務の健全性の確保
  • 顧客本位の業務運営
  • 少額短期保険業者の態勢整備

2021年保険モニタリングレポートのWordCloud

このwordcloudは、以下のコードで作成されたものです。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
import numpy as np
import re
from janome.tokenizer import Tokenizer
from tika import parser
from wordcloud import WordCloud
 
file_data = parser.from_file("210910.pdf") # ダウンロードしたレポートを読み込み
text = file_data["content"].replace('\n','')
 
def get_word_str(text):
 
    t = Tokenizer()
    token = t.tokenize(text)
    word_list = []
  
    for line in token:
        tmp = re.split('\t|,', str(line))
        # 名詞のみ対象
        if tmp[1] in ["名詞"]:
            # さらに絞り込み
            if tmp[2] in ["一般", "固有名詞"]:
                word_list.append(tmp[0])
  
    return " " . join(word_list)
 
word_str = get_word_str(text)
 
wc = WordCloud(font_path=r'C:\Windows\Fonts\msgothic.ttc'
               , max_font_size=70
               , min_font_size=10
               , width=800
               , height = 400
               , background_color="white").generate(word_str)
wc.to_file("ins_monitoring.png")