「2021年 保険モニタリングレポート」をWordCloudで可視化してみる
金融庁から「2021年保険モニタリングレポート」が公表されました。
人口減少、技術革新、低金利、顧客ニーズの変化、気候変動などの外部環境を背景に、金融庁が提示する保険会社の課題は以下の6つ。
- 持続可能なビジネスモデルの構築
- グループガバナンスの高度化
- 自然災害の多様化・激甚化への対応
- 財務の健全性の確保
- 顧客本位の業務運営
- 少額短期保険業者の態勢整備
2021年保険モニタリングレポートのWordCloud

このwordcloudは、以下のコードで作成されたものです。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 | import numpy as np import re from janome.tokenizer import Tokenizer from tika import parser from wordcloud import WordCloud file_data = parser.from_file( "210910.pdf" ) # ダウンロードしたレポートを読み込み text = file_data[ "content" ].replace( '\n' ,'') def get_word_str(text): t = Tokenizer() token = t.tokenize(text) word_list = [] for line in token: tmp = re.split( '\t|,' , str (line)) # 名詞のみ対象 if tmp[ 1 ] in [ "名詞" ]: # さらに絞り込み if tmp[ 2 ] in [ "一般" , "固有名詞" ]: word_list.append(tmp[ 0 ]) return " " . join(word_list) word_str = get_word_str(text) wc = WordCloud(font_path = r 'C:\Windows\Fonts\msgothic.ttc' , max_font_size = 70 , min_font_size = 10 , width = 800 , height = 400 , background_color = "white" ).generate(word_str) wc.to_file( "ins_monitoring.png" ) |