New Fashion Machine +

ファッション専門ブックマーク New Fashion Machine の補足説明です。

ブックマークデータを2万件ずつPythonで形態素解析 その8

前回からの続きです。それでは14万件〜約16万件目の頻出ワードランキング100位までをどうぞ。

  • ランキングは主に名詞(名詞じゃないのも混ざってます)
  • 100位までカウントしてみました
  • 記号や数字などのノイズは飛ばしてます
  • 前の数字は順位
  • 後ろの数字は出現回数

5 ブログ 14669
7 店 11013
14 さん 5822
19 ファッション 4918
21 ブランド 4344
23 一覧 4111
26 ショップ 3538
27 商品 3364
28 記事 3363
31 情報 2800
32 こと 2745
33 市 2729
38 販売 2365
41 中 2323
43 ページ 2230
44 サイト 2211
47 画像 2184
48 人 2173
49 紹介 2140
51 通販 2105
52 株式会社 2089
53 2012 2033
54 アイテム 1964
56 服 1917
57 東京 1897
60 最新 1835
61 2015 1833
62 女性 1786
63 円 1762
64 Ameba 1752
66 セレクト 1691
67 日本 1683
68 雑貨 1660
69 ブログトップ 1653
70 区 1623
72 発売 1585
73 説明 1585
74 開催 1558
75 テーマ 1547
76 新作 1520
77 古着 1520
78 県 1499
79 入荷 1476
80 入力 1472
81 2013 1440
82 デザイン 1407
84 2014 1380
86 人気 1362
87 よう 1339
89 大阪 1318
90 ニュース 1305
91 店舗 1305
92 靴 1291
93 的 1277
94もの 1266
95 ♪ 1262
96 品 1239
98 イベント 1224
99 オープン 1220

今回もあまり特徴ないですね。2012年〜2015年のブックマークが多いようです。

以上で全て解析終わりです。読んでくださった方ありがとうございました!もっと面白いことできるようになりたいです。

ブックマークデータを2万件ずつPythonで形態素解析 その7

前回からの続きです。それでは12万件〜14万件目の頻出ワードランキング100位までをどうぞ。

  • ランキングは主に名詞(名詞じゃないのも混ざってます)
  • 100位までカウントしてみました
  • 記号や数字などのノイズは飛ばしてます
  • 前の数字は順位
  • 後ろの数字は出現回数

7 ブログ 11434
8 店 9273
18 ファッション 4733
20 2012 4478
25 商品 3621
26 ブランド 3508
27 ショップ 3363
28 情報 2941
32 販売 2703
33 こと 2699
34 株式会社 2608
35 市 2494
36 さん 2395
38 紹介 2275
39 中 2270
40 服 2219
42 雑貨 2168
43 2011 2165
46 サイト 2038
47 人 2030
49 記事 1942
53 東京 1852
55 県 1840
56 日本 1819
57 説明 1814
58 女性 1780
59 一覧 1755
61 プロフィール 1732
63 円 1632
64 入力 1623
65 アイテム 1619
67 通販 1572
69 ページ 1549
70 開催 1543
72 デザイン 1511
73 ♪ 1484
74 ニュース 1476
75 よう 1437
77 セレクト 1421
80 発売 1382
82 専門 1372
83 的 1366
84 大阪 1358
85 人気 1349
86 入荷 1343
87 モデル 1341
88 新作 1334
91 オープン 1296
92 テーマ 1284
93 もの 1273
94 区 1273
95 時間 1268
97 アクセサリー 1218
98 イベント 1208
99 店舗 1184
100 部屋 1173

うーん、あんまり特徴のないデータですね。2011年〜2012年ごろのブックマークが多いようですね。

次で最後!

ブックマークデータを2万件ずつPythonで形態素解析 その6

前回からの続きです。それでは10万件〜12万件目の頻出ワードランキング100位までをどうぞ。

  • ランキングは主に名詞(名詞じゃないのも混ざってます)
  • 100位までカウントしてみました
  • 記号や数字などのノイズは飛ばしてます
  • 前の数字は順位
  • 後ろの数字は出現回数

1 ブログ 20938
7 店 13352
12 プロフィール 6350
18 紹介 4473
19 情報 4325
21 ニックネーム 4100
26 説明 3632
27 市 3630
28 ファッション 3602
29 部屋 3441
30 さん 3404
31 入力 3337
32 商品 3323
35 ピグ 3228
38 ショップ 3128
41 こと 2866
44 県 2782
47 販売 2555
49 ♪ 2548
50 ルーム 527
51 ブログ2439
52 ブランド 2394
53 記事 2365
54 ブログジャンル 2286
58 靴 2186
59 雑貨 2171
60 2010 2100
62 屋 2069
63 中 2064
66 ミシン 1946
69 株式会社 1924
70 女性 1910
71 メッセージ 1908
73 人 1862
74 服 1862
75 自己 1835
76 型 1822
77 スタッフ 1795
78 東京 1734
79 日記 1705
83 専門 1630
85 プレゼント 1625
86 アメンバー 1624
89 性別 1596
93 修理 1511
94 日々 1501
95 区 1494
96 大阪 1466
99 店長 1451
100 最近 1446

これはおそらくアメブロをブックマークしまくっていた時期ですね。関連用語がたくさんランクインしています。東京は毎回ランクインしていますがここにきて大阪もランクイン。関西在住なのでなんだかうれしい。

あと2回お付き合いください。

ブックマークデータを2万件ずつPythonで形態素解析 その5

前回からの続きです。それでは8万件〜10万件目の頻出ワードランキング100位までをどうぞ。

  • ランキングは主に名詞(名詞じゃないのも混ざってます)
  • 100位までカウントしてみました
  • 記号や数字などのノイズは飛ばしてます
  • 前の数字は順位
  • 後ろの数字は出現回数

8 ブログ 9490
14 店 6372
18 ファッション 4593
22 こと 3575
23 さん 3366
29 2010 3135
30 商品 3094
31 Twitter 3066
32 情報 2890
33 2009 2859
34 いま 2757
36 紹介 2720
39 人 2629
40 ブランド 2602
41 中 2531
42 ニュース 2332
43 ショップ 2286
48 サービス 1941
49 東京 1935
50 販売 1926
51 円 1877
54 無料 1786
55 市 1784
56 on 1773
57 ♪ 1766
58 よう 1721
59 もの 1705
60 日本 1680
63 可能 1646
64 サイト 1642
66 jp 1603
70 ほか 1566
71 形 1563
72 登録 1555
74 雑貨 1519
75 シンプル 1517
76 ユーザー 1510
77 デザイン 1488
78 時間 1484
79 女性 1476
80 今日 1472
82 発売 1451
83 質問 1446
85 的 1434
86 日記 1421
88 説明 1415
89 なに 1404
91 前 1369
93 交流 1364
94 方 1353
97 ツイート 1339
98 受信 1336
100 人気 1271

前回からガラッと中身が変わった印象。2009、2010という数字がランクインしていることからその頃のブックマークと思われます。Twitterが流行り始めた時期かな?関連ワードが多いですね。続きます。夜までに終わるかなぁ。

ブックマークデータを2万件ずつPythonで形態素解析 その4

前回からの続きです。それでは6万件〜8万件目の頻出ワードランキング100位までをどうぞ。

  • ランキングは主に名詞(名詞じゃないのも混ざってます)
  • 100位までカウントしてみました
  • 記号や数字などのノイズは飛ばしてます
  • 前の数字は順位
  • 後ろの数字は出現回数

5 ファッション 18705
9 ブログ 10979
12 ブランド 6867
14 店 6314
19 2009 5247
20 ショップ 4968
21 県 3891
29 こと 3308
30 セレクト 3258
31 さん 3131
32 情報 3000
34 市 2989
37 商品 2883
39 人 2636
42 the 2528
43 紹介 2422
45 中 2338
46 イベント 2313
49 東京 2105
50 円 2088
51 shop 2052
53 日本 1970
54 雑貨 1939
55 ニュース 1938
56 レディース 1937
57 販売 1920
58 and 1893
60 ビジネス 1785
62 的 1770
67 サイト 1698
69 女性 1666
70 モデル 1645
71 よう 1616
72 of 1590
74 ♪ 1574
75 オープン 1568
77 今日 1539
78 デザイン 1528
79 もの 1522
80 服 1521
83 誌 1501
85 アイテム 1483
86 Fashion 1449
87 to 1447
88 com 1430
90 in 1423
91 アクセサリー 1402
92 発売 1391
93 人気 1359
94 バッグ 1319
95 入荷 1316
96 写真 1302
97 by 1298
98 開催 1298
99 日記 1280

なんだろうこの地味なブログは…。決してキーワードスパムではないですよ。「the」や「of」など入れようか迷いましたが入れてみました。続きまーす。あと半分!

ブックマークデータを2万件ずつPythonで形態素解析 その3

前回からの続きです。それでは4万件〜6万件目の頻出ワードランキング100位までをどうぞ。

  • ランキングは主に名詞(名詞じゃないのも混ざってます)
  • 100位までカウントしてみました
  • 記号や数字などのノイズは飛ばしてます
  • 前の数字は順位
  • 後ろの数字は出現回数

4 ファッション 20177
9 ブランド 8108
12 ブログ 6735
13 店 6710
14 ショップ 6335
29 セレクト 4314
25 情報 3617
26 こと 3613
28 県 3521
31 さん 3129
32 商品 3096
33 2008 2926
36 市 2845
37 人 2790
38 紹介 2785
39 中 2780
40 shop 2653
44 雑貨 2415
45 東京 2228
46 女性 2192
47 2009 2180
49 よう 2039
50 イベント 2023
51 円 1976
53 販売 1938
54 ♪ 1932
55 的 1929
56 服 1915
57 もの 1888
58 アイテム 1879
59 今日 1853
60 入荷 1853
61 日本 1852
62 デザイン 1851
63 ニュース 1815
65 サイト 1794
66 アクセサリー 1741
67 オープン 1715
70 人気 1686
72 モデル 1617
73 色 1585
74 バッグ 1571
75 方 1522
80 ビジネス 1481
82 日記 1447
83 写真 1436
85 区 1410
86 発売 1394
89 誌 1343
90 開催 1343
91 私 1327
93 デザイナー 1271
95 新作 1236
96 今回 1223
97 スタッフ 1219
99 春 1190
100 jp 1182

前回とあまり変わらない感じですね。2009という数字が出てきたということは2009年ごろのデータかもしれません。

ブックマークデータを2万件ずつPythonで形態素解析 その2

前回からの続きです。それでは2万件〜4万件目の頻出ワードランキング100位までをどうぞ。

  • ランキングは主に名詞(名詞じゃないのも混ざってます)
  • 100位までカウントしてみました
  • 記号や数字などのノイズは飛ばしてます
  • 前の数字は順位
  • 後ろの数字は出現回数

5 ファッション 17397
8 ブログ 10076
12 ショップ 5835
14 ブランド 5333
17 店 4552
20 セレクト 4120
22 こと 3855
25 さん 3531
28 情報 3262
29 2008 3140
30 shop 3033
32 人 2892
34 中 2838
37 商品 2592
38 雑貨 2571
39 紹介 2511
40 方 2278
41 よう 2257
42 色 2186
43 ♪ 2055
45 今日 2019
48 日記 1909
49 入荷 1868
50 もの 1830
53 Blog 1819
54 私 1806
56 市 1776
57 アクセサリー 1708
58 サイト 1697
59 写真 1633
60 県 1625
61 イベント 1579
62 服 1542
64 的 1530
66 古着 1504
68 販売 1471
70 日本 1422
72 東京 1416
74 カラー 1373
76 女性 1354
77 モデル 1353
78 デザイン 1342
80 屋 1324
81 アイテム 1314
82 秋 1287
83 今回 1274
86 会 1236
87 円 1186
89 今 1180
90 人気 1177
92 事 1145
93 スタッフ 1136
94 メイド 1133
95 自分 1130
96 ため 1125
98 時間 1087
100 ビジネス 1065

以上でした。94位のメイドというのは多分ハンドメイドのメイドですね。ハンドはどこいった?続きます。整形が地味に大変!