
Người gác cổng "cấp độ đầu vào": Kiểm toán mô tả công việc bằng Textstat
Bài viết này trình bày cách sử dụng các công cụ mã nguồn mở, miễn phí như Python và thư viện Textstat để xây dựng một tập lệnh tự động hóa quy trình phát hiện "ngôn ngữ rào cản" trong các bản mô tả công việc trước khi công bố.
Người gác cổng "cấp độ đầu vào": Kiểm tra mô tả công việc bằng Textstat - KDnuggets
Bài viết này trình bày cách sử dụng các công cụ mã nguồn mở, miễn phí như Python và thư viện Textstat để xây dựng một tập lệnh tự động hóa quy trình phát hiện "ngôn ngữ rào cản" trong các mô tả công việc trước khi công bố.
Bởi Iván Palomares Carrascosa, Chuyên gia Nội dung Kỹ thuật của KDnuggets vào ngày 29/5/2026 trong Xử lý Ngôn ngữ Tự nhiên
# Giới thiệu
Bạn đã bao giờ bắt gặp một mô tả công việc "cấp độ đầu vào" mà trong đó các yêu cầu đối với ứng viên bao gồm những khía cạnh khó hiểu như "tận dụng các mô hình đa chức năng để tối ưu hóa kết quả hiệp lực", hoặc thậm chí tệ hơn chưa? Khi các tài liệu nhân sự chứa đầy biệt ngữ khó hiểu hoặc thuật ngữ kinh doanh, chúng không chỉ gây nhầm lẫn cho người đọc mà còn khiến những người tìm việc tài năng, có năng lực phải e ngại. Vì bước đầu tiên hướng tới sự hòa nhập là khả năng tiếp cận, tại sao không đảm bảo mô tả công việc của bạn duy trì giọng điệu dễ tiếp cận thông qua các quy trình kiểm tra?
Bài viết này trình bày cách sử dụng các công cụ mã nguồn mở, miễn phí như Python và thư viện xử lý ngôn ngữ tự nhiên (NLP) Textstat để xây dựng một tập lệnh tự động hóa quy trình phát hiện "ngôn ngữ rào cản" trong các mô tả công việc trước khi công bố.
# Thành phần chính: Chỉ số Gunning Fog
Chỉ số Gunning Fog — có sẵn trong Textstat bằng cách sử dụng textstat.gunning_fog — là một phương pháp tuyệt vời để kiểm tra văn bản, đặc biệt là các danh sách việc làm cấp độ đầu vào. Về bản chất, chỉ số này có thể được sử dụng để ước tính số năm học chính quy mà một người có thể cần để hiểu một văn bản ngay lần đọc đầu tiên.
Việc tính toán dựa trên việc quan sát hai yếu tố chính: độ dài câu trung bình và tỷ lệ các thuật ngữ phức tạp — thường là các từ có ba âm tiết trở lên. Lưu ý rằng biệt ngữ kinh doanh thường lạm dụng các từ thông dụng nhiều âm tiết như "operationalization", "methodologies", v.v. Do đó, Chỉ số Gunning Fog tiếp cận chặt chẽ mục tiêu của chúng ta là kiểm tra các mô tả công việc để đảm bảo chúng không quá phức tạp đối với đối tượng mục tiêu mà chúng muốn thu hút. Nói cách khác, nó giúp đảm bảo ngôn ngữ rõ ràng và dễ tiếp cận. Giá trị thấp hơn của chỉ số này có nghĩa là độ rõ ràng và khả năng tiếp cận cao hơn.
# Kiểm tra một ví dụ bằng Textstat
Bước quan trọng đầu tiên là cài đặt thư viện Textstat cho Python nếu bạn chưa thực hiện:
pip install textstat
Logic cốt lõi của tập lệnh của chúng ta sẽ nằm trong một hàm có thể tái sử dụng với mục đích kiểm tra một văn bản đầu vào — ví dụ: mô tả công việc cấp độ đầu vào:
import textstat
def audit_job_description(job_text):
# Tính toán Chỉ số Gunning Fog
fog_score = textstat.gunning_fog(job_text)
# Xác định phán quyết về tính hòa nhập dựa trên điểm số
if fog_score
Các bước thực hiện trong hàm trước đó khá đơn giản. Đầu tiên, chúng ta tính toán trực tiếp điểm Gunning Fog cho văn bản (có thể là mô tả công việc) được truyền vào. Điểm này, được lưu trữ trong `fog_score`, trải qua một kiểm tra điều kiện đơn giản để đưa ra ba kết luận khác nhau dựa trên độ phức tạp của văn bản — tương tự như hệ thống đèn giao thông ba màu.
Nói chung, một văn bản có điểm Gunning Fog dưới 10 được coi là dễ tiếp cận và lý tưởng cho mô tả công việc cấp độ đầu vào. Điểm từ 10 đến 14 có độ phức tạp vừa phải, và điểm trên 14 được coi là rất phức tạp và cần sửa đổi đáng kể.
Tiếp theo, đã đến lúc kiểm tra công cụ kiểm toán của chúng ta bằng cách truyền vào hai mô tả công việc mẫu khác nhau:
# VÍ DỤ 1: Mô tả công việc "Gatekeeper"
complex_jd = """
Ứng viên thành công sẽ tận dụng các mô hình đa chức năng để tối ưu hóa các sản phẩm chuyển giao hiệp lực.
Bạn sẽ được kỳ vọng vận hành các chỉ số hiệu suất chính và tạo điều kiện cho các phương pháp cải tiến liên tục
để tối đa hóa lợi tức đầu tư của chúng tôi và thể chế hóa các năng lực cốt lõi trên toàn hệ sinh thái tổ chức.
"""
# VÍ DỤ 2: Mô tả công việc "Inclusive"
inclusive_jd = """
Chúng tôi đang tìm kiếm một thành viên trong nhóm để giúp chúng tôi phát triển các kênh tiếp thị.
Bạn sẽ làm việc chặt chẽ với các nhóm khác nhau để triển khai các chiến dịch, theo dõi hiệu quả của chúng và tìm ra những cách mới để cải thiện.
Mục tiêu của bạn là giúp chúng tôi tiếp cận nhiều khách hàng hơn và chia sẻ câu chuyện thương hiệu của chúng tôi.
"""
print("--- Mô tả công việc Gatekeeper ---")
print(audit_job_description(complex_jd))
print("\n--- Mô tả công việc Inclusive ---")
print(audit_job_description(inclusive_jd))
Đầu ra:
--- Mô tả công việc Gatekeeper ---
{'Gunning-Fog Score': 30.364102564102566, 'Verdict': 'Cảnh báo Gatekeeper: Mật độ thuật ngữ chuyên ngành cao. Viết lại để rõ ràng hơn.'}
--- Mô tả công việc Inclusive ---
{'Gunning-Fog Score': 8.165986394557823, 'Verdict': 'Dễ tiếp cận & Bao trùm. Tuyệt vời cho cấp độ đầu vào.'}
Công cụ kiểm toán của chúng ta đã làm rất tốt việc phát hiện mô tả đầu tiên là một "gatekeeper" rõ ràng — một rào cản gia nhập — và khuyến nghị viết lại để rõ ràng và bao trùm hơn. Mô tả thứ hai đạt điểm thấp hơn nhiều là 8,16 (so với 30,36 của mô tả đầu tiên, tương đương với các bài nghiên cứu sau đại học về độ phức tạp ngôn ngữ), xác nhận rằng nó rất phù hợp để thu hút các ứng viên cấp độ đầu vào.
# Tổng kết
Mô tả công việc thường là cánh cửa đầu tiên của một công ty, và thuật ngữ kinh doanh quá mức có thể hoạt động như một người gác cổng trong những tình huống mà sự cởi mở là quan trọng nhất — đặc biệt đối với các vai trò cấp độ đầu vào. Bài viết này đã chỉ ra cách sử dụng chỉ số Gunning Fog của Textstat.
Nguồn tin: KDnuggets — Tác giả: Iván Palomares Carrascosa. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.