- 使用 PyTorch 和 BertForMaskedLM 偵測錯別字並建議正確用字
在自然語言處理中,偵測錯別字並提供正確的修正建議是一個重要的任務。本文將介紹如何使用 PyTorch 和 BertForMaskedLM 模型來實現這一功能。我們將使用 BERT 模型進行預訓練,並利用其能力來預測遺漏或錯誤的詞彙。
- 關於我如何考取Tensorflow開發者認證
幾個月前偶然機會下參加了ML Study Jam 機器學習培訓計劃 2020 這個線上活動,獲得了Tensorflow exam報名補助金(嚴格來說是報銷報名費一次)。對機器學習知曉皮毛而且缺乏TF實戰經驗的我,當然是由零開始學習使用TF,為考試一take pass做好準備。
- Google Ads搜尋廣告認證學習筆記
早些時候跟以前公司的Marketing同事吃飯聊聊,才知道Google整理了一系列跟市埸營銷有關的免費認證。雖然幾年前也曾經有給客戶落廣告的經驗,但始終沒有踏實基礎,而且所使用的工具也變化了不少,所以這個月便試試修畢搜尋廣告認證。
- 2020年N個作為Web開發人員的常用工具
市道不穩,所以在這個星期向公司請辭了,並準備迎接新的工作。今早雷雨交加,打算整理一下過往工作上使用過的軟體工具,方便我入職第一日可以快速配置新機台。
- 如何正確地為網站做SEO
要讓更多人能夠得知並接觸得到我們的產品或服務,推廣自家網站是必不可少的一步,也就是要為我們的網站做搜尋引擎優化(Search Engine Optimization)。市場上有很多公司為各大中小企提供SEO服務,協助分析網站內容,投放廣告,然後成效報告裡寫了一堆似昰疑非的數字,但收入又沒有想像中的提升,是哪裡錯了嗎?
- 在Rust中使用enum自定義錯誤類型
Rust這款語言並不強調Object-Oriented特性,也沒有既定的錯誤處理機制,所以自定義錯誤的方法也有别於其他慣用語言,這𥚃介紹使用enum來實作。
- InfluxDB使用問題與優化紀錄
一個運轉一年多的 NodeJS 專案,每分鐘向 InfluxDB 寫入 40~50 個 point,某天發現不時出現
ETIMEOUT
以及No host available
連接問題,導致部分資料無法儲存。 - 用cronjob解決puppeteer_dev_profile殘留問題
puppeteer_dev_profile是透過puppeteer操作Headless Chrome時會在 /tmp 自動產生的資料夾。倘若程序沒有正確關閉chrome進程﹐/tmp/puppeteer_dev_profile-* 將無法自動回收並殘留在檔案系統上,佔用不必要的硬盤空間。
- 暫停MySQL索引更新和參照檢查
在MySQL數據庫處理資料時,InnoDB會為每行資料逐一檢查其外鍵(Foreign Key Check),而MyISAM則更新表格索引(Indexing),對於大量的資料滙入或更新會帶來更長的執行時間。這時我們更希望是在所有資料寫入以後才一次性地進行檢查和索引更新。
- 利用binlog修復MySQL數據
最近因為一次手殘剷除了production主機上的MySQL數據庫,需要從最近時間點的備份中還原,並且從binlog中提取該時間點後的部分重要query重新執行,以盡可能回復原狀。