python

Python奮闘記

Python奮闘記 目次

《 はじめに 》  知財情報の分析に強力なツールになると思い、Pythonの勉強を始めました。きっかけになったのは、株式会社ライズの東智朗さんが開催してくださった「知財人のためのPython」です。初心者の私に初歩から丁寧に教えてくださいま...
Python奮闘記

[Python] 基礎-8 pdfファイルの読み込み

1.準備  "pypdf"モジュールのインストール Anaconda Powershell Prompt >> pip install pypdf 2.複数のpdfファイルの連結(PdfMerger) """ import pypdf # ...
Python奮闘記

[Python] 正規表現を使ったFターム分析

〘 背景 〙 日本の特許文献には、FIとFタームと呼ばれる特許分類が付与されている。FIは国際特許分類(IPC)と同じ階層構造で、日本の実情に合わせて細分化されている。Fタームは、テーマコードごとに種々の観点について付与された特許分類コード...
Python奮闘記

[Python] 基礎-7 EXCELファイルの読み書き

1.一般的な流れ "openpyxl"モジュールをインポート:import openpyxlWorkbookを開く:openpyxl.load_workbook("ファイル名")シートオブジェクトを生成:sheet_obj = workbo...
Python奮闘記

[Python] 基礎-6 csvファイルの読み込み

1.一般的な流れ (1) "csv"モジュールを使った読み込み"csv"モジュールをインポート import csv open関数を使ってcsvファイルオブジェクト(csv_obj)を生成csv_obj.reader ⇒ 行単位(itera...
Python奮闘記

[Python] 出願人名の名寄せ

〘 課題 〙「名寄せ」とは、表記を一つにまとめること。出願人名は、企業、団体、学校、研究機関、個人などの名称で、主体が同じでも完全に統一されていて変更されないというわけではない。例えば、会社名の変更、合併などで名称が変更されることがある。そ...
Python奮闘記

[Python] ダウンロードしたcsvに対する発明者分析

〖 課題 〗 ダウンロードしたcsvファイルの特許文献リストから、発明者ごとに出願年と件数を抽出することによって、出願人がリストの特許分野に何人の発明者を投入したのかを知ることができる。 〖 仕様 〗 入力:csvファイルで、「発明者」、「...
Python奮闘記

[Python] ダウンロードしたcsvファイル(zip圧縮)を解凍

に、abcd.zipに圧縮されダウンロードされたcsvファイルが複数格納されている。解凍するとcsvDLフォルダ内にabcdフォルダが解凍され、その中にabcd-xyz.csvファイルが再生される。 〖前提〗  csvDLフォルダの作られて...
Python奮闘記

[Python] 基礎-5 正規表現(regular expression)

正規表現(regular expression)(末尾のまとめ表)を使った、高機能な文字列 1. 一般的な流れ 1.1 関数 ”re"モジュールをインポート:import reプログラム中に関数 match関数: re.match(r' 正...
Python奮闘記

[Python] 基礎-4 文字列処理

1.文字列データ 文字列データ:シングルまたはダブルクォーテーションで囲む '・・・・・・' OR "・・・・・・" エスケープ文字 バックスラッシュ「\」+文字で特別な意味を持つ文字(制御文字など)を表す注:バックスラッシュ「\」は円マー...