Được dịch từ bài viết có tiêu đề Why Do Virtual Meetings Feel So Weird? của Giáo sư Nhân học Elizabeth Keating đăng trên tạp chí Sapiens. (link gốc của bài ở đây)
Bài viết còn nhiều hạn chế do một số thuật ngữ trong ngành khó để dịch chính xác cũng như một vài điểm còn tối nghĩa nên mình rất mong nhận được đóng góp, sửa chữa từ mọi người.
Đó là một buổi sáng ở Houston, Texas, đối với Jeremy* và đội kĩ sư của anh ấy, và là gần tối tại một thị trấn nhỏ phía bắc Bucharest, Romania, đối với Costa và đội của anh ta khi tất cả họ đang cùng ngồi xuống cho một cuộc họp qua điện thoại vào năm 2011.
Họ đã đi đến mục thứ tư trong chương trình họp của mình khi Jeremy nhận ra đội ở Houston đã vận hành với giả định sai về số lượng máy bơm trong thiết kế nhà máy xăng dầu mà họ đang thực hiện.
“Có ai biết về điều này chưa?” Jeremy hỏi Steve, người ngồi kế bên anh ta.
“Hỏi hay đấy,” Steve nói.
Với tư cách một nhà nhân học đang quan sát họ, tôi nhận ra đây là một câu hỏi lớn và vô định hình. Có quá nhiều sự mơ hồ về việc ai biết những gì và thông tin nào đang được đề cập ở đâu. Khoảng cách đã dẫn tới ít nhất một sự hiểu lầm nghiêm trọng.
Trước năm 2008, mọi người trong đội đó ở trong cùng một văn phòng. Những bản vẽ được giữ trong phòng đội, và những người kĩ sư đến và kiểm tra cùng một phiên bản thiết kế. Biết rõ số lượng máy bơm sẽ là một điều không cần bàn cãi. Hồi đó, thông tin chảy một cách dễ dàng quanh văn phòng, và khi một kĩ sư mới tham gia đội, họ học được nhiều điều chỉ đơn giản bằng việc quan sát mọi thứ trong quá trình bình thường của một ngày.
Giờ thì mọi thứ đã khác.
Đại dịch Covid-19 có nghĩa là nhiều người hơn, đơn cử như những kĩ sư này, đang làm việc với những nhiệm vụ phức tạp thông qua màn hình máy tính. Năm năm trước, khoảng một phần ba các tổ chức trong “các lĩnh vực sản xuất, cố vấn, chuyên môn, khoa học và công nghệ” có những nhân viên làm việc từ xa; giờ thì hầu hết một nửa số lao động Mỹ phải làm việc kiểu này.
Các video hướng dẫn giao tiếp từ xa có xu hướng tập trung vào các vấn đề kĩ thuật, bề ngoài (như tóc và trang phục một người), ánh sáng, phông nền, và cách để xử lý những sự xen ngang và những điều kỳ lạ trong không gian “tại gia”: tiếng chó sủa hay một đứa trẻ gõ cửa văn phòng. Nhưng có rất nhiều thứ để nói về kiểu giao tiếp này.
Đối với một số người, làm việc tại nhà đang dần trở thành một sự bình thường mới.  Jack Sparrow/<a href="https://www.pexels.com/photo/man-with-laptop-having-breakfast-4045927/" target="_blank">Pexel</a>
Đối với một số người, làm việc tại nhà đang dần trở thành một sự bình thường mới. Jack Sparrow/Pexel
Với tư cách một nhà nhân học ngôn ngữ học, tôi đã quan tâm đến sự tương tác qua trung gian công nghệ kể từ khi webcam lần đầu trở lên sẵn có một cách rộng rãi vào cuối thập niên 1990; tôi đã viết một cuốn sách về nó vào năm 2016. Tôi có thể thấy tại sao mọi người ngày nay đang phê bình, với một vài sự mỉa mai thay, rằng dù những lời hứa to lớn của công nghệ đang giữ mọi người kết nối với nhau trong khi ở trong trạng thái an toàn tránh xa các nguy cơ gây hại, nhưng họ đang trải qua những thất vọng không lường được trong sự cô lập, sự mệt mỏi, cảm thấy lạc lõng và sự vắng mặt cộng đồng.
Jeremy và Costa là một phần trong những nghiên cứu gần đây nhất của tôi về giao tiếp từ xa. Tôi đã tiến hành nghiên cứu trong đội của họ trong khi họ thiết kế các nhà máy chế biến xăng dầu hiện đại từ các địa điểm cách xa nhau giữa những năm 2008 và 2011, và một lần nữa vào 2016 và 2017. Mặc dù một vài thành viên của dự án này đang ở cùng một văn phòng, nhưng chuyên môn trong đội đã được phân bổ khoảng trên 30 đến 50 người ở ít nhất hai lục địa.
Như nhiều người ngày nay, Jeremy và Costa dựa vào email để gửi các tài liệu và đánh giá và chỉ định những nhiệm vụ. Họ có những cuộc gọi họp hàng tuần: cả các cuộc gọi audio để thảo luận về những danh mục hoạt động và cả các cuộc gọi video để đánh giá và sửa đổi các mô hình mà họ tạo ra.
Trước khi tôi gặp các kĩ sư và biết được cuộc sống làm việc của họ, những quản lý của các công ty này đã nói với tôi rằng lợi nhuận tài chính mà họ đã dự đoán từ sự hợp tác quốc tế trực tuyến của họ đã không thành hiện thực. Điều này một phần bởi vì chi phí quản lý tăng lên của một đội ở xa.
Hầu hết mọi người hiếm khi nghĩ đến giao tiếp phi ngôn ngữ và sự tham gia ngoại vi
Nhưng điều gì đang xảy ra? Tôi lúc đầu đã nghe nhiều kĩ sư mô tả văn hóa như một yếu tố có thể tạo ra hoặc phá vỡ những đội kĩ sư ảo – vốn từ vựng, cùng với những giả định và các thủ tục chưa được xác định, có thể khác biệt tùy theo từng nơi. Đây là một vấn đề, tôi biết, nó quá thường xuyên bị đánh giá thấp.
Từ những điều mà các kĩ sư đã nói trong buổi gặp mặt giới thiệu, tôi giả định rằng những khác biệt văn hóa, cùng với những hậu cần khó khăn như múi giờ, sẽ là những điều làm cho công việc của họ thêm thách thức, và là yếu tố chính để trả lời câu hỏi có phần bực tức của Jeremy, “sao họ lại không hiểu họ phải làm gì nhỉ?” Nhưng tôi đã phỏng đoán sai.
Nó hóa ra rằng nhân tố lớn gây nên sự bực tức và phải làm lại nhiều thứ chính là sự thiếu vắng hai dạng kiến thức quan trọng đối với bất kỳ đội nhóm nào và với bất kì sự tương tác nào: giao tiếp phi ngôn ngữ và sự tham gia ngoại vi. Phần lớn mọi người hiếm khi suy nghĩ về hai loại giao tiếp này – chúng chỉ mới trở thành những chủ đề nghiên cứu gần đây trong một thế giới làm việc trực tuyến.
Những người làm việc tại gia bây giờ đang trải qua những sự thay đổi khá mạnh mẽ trong cái mà nhà xã hội học Erving Goffman mô tả một cách khéo léo trong những cuốn sách của ông ấy vào những năm 1960 là “tương tác tập trung.”
Ý của Goffman ở đây đó là không chỉ sự trao đổi lời nói trong tương tác mà còn là vai trò quan trọng của quan sát thị giác. Những cái liếc nhìn nhỏ đối với ông ấy không phải là các chi tiết nhỏ nhặt. Như ông ấy đã đề cập, mỗi chúng ta chú ý đến cách mà ta đang được trải nghiệm bởi người khác. Xa hơn, mỗi người có để được nhìn thấy thông qua việc đang nhìn thấy rằng họ đang được trải nghiệm theo một cách cụ thể bởi những người khác, và mỗi người “có thể thấy rằng anh ta đang được thấy khi nhìn thấy điều này.”
Các tương tác người người trực tiếp đi cùng với một loạt các dấu hiệu và công cụ trực quan hỗ trợ sự thấu hiểu. Fauxels/<a href="https://www.pexels.com/photo/two-women-standing-beside-brown-board-on-wall-3184296/" target="_blank">Pexels</a>
Các tương tác người người trực tiếp đi cùng với một loạt các dấu hiệu và công cụ trực quan hỗ trợ sự thấu hiểu. Fauxels/Pexels
Với cách nói khó hiểu này, Goffman đang hiểu được cách con người quan sát nhau đầy năng động và đối ứng. Ta sử dụng những gì ta thấy để quyết định cách phản ứng và những điều ta làm tiếp theo, và thậm chí để dự đoán hành vi trong tương lai của ai đó, và cái nhìn đó có thể bao gồm khá nhiều người. Cái cách ta tập trung và thấu hiểu lẫn nhau có những tính kinh tế thanh lịch nhất định đối với nó; nó xảy ra trong khi ta đang tập trung vào những điều khác.
Khả năng để thấy mọi người và quan sát họ quan sát ta trong công việc xây dựng một khuôn khổ cho nhiều phần quan trọng của làm việc nhóm. Nó giúp ta thiết lập lòng tin, duy trì sự cam kết, xác nhận sự hiểu biết và đồng thuận, hoặc thấu hiểu các trạng thái cảm xúc. Goffman đã có một cái nhìn của một nhà nhân học về những chi tiết trong tương tác con người.
Hầu hết mọi người nhận ra rằng trong sự chuyển đổi từ văn phòng sang thiết lập từ xa trực tuyến, ta đang mất dần những thông tin quan trọng về rất nhiều người ta phụ thuộc vào để hoàn thành công việc. Đây một phần là lý do tại sao nó thường xuyên được cảm thấy là hình thức làm việc thiếu hài lòng, mệt mỏi hơn. Thậm chí dù ta thường xuyên có những thông tin trực quan tốt về ít nhất là những khuôn mặt của mọi người với những công nghệ tinh vi, ta không có nhiều thông tin như khi ta có được từ sự tương tác vật lý trực tiếp.
Trong thuật ngữ của Goffman, ta mất đi khả năng quan sát những người khác đang quan sát ta, vì ta thường không rõ rằng ánh nhìn của họ đang hướng về đâu (Họ đang nhìn vào những cái màn hình, không phải chúng ta).
Những hiểu biết mà được truyền tải qua cơ thể của ta – thường được nhắc tới như là giao tiếp phi ngôn ngữ – hiếm khi được xem xét cẩn trọng. Đó là cái tên của nó, cho một điều. Ta có thể nghiêm túc hiểu một vài thứ như thế nào khi ta dán nhãn nó bởi điều mà nó không phải như thế? Không có một khoa/viện nào trong các trường đại học dành riêng cho giao tiếp phi ngôn ngữ hay giao tiếp hiện thân (Embodied communication), và một vài đầu sách giao tiếp chỉ xem xét nó trong sự thảo luận qua loa.
Cử chỉ tay và tư thế cơ thế là một phần quan trọng trong hội thoại.  Jopwell/<a href="https://www.pexels.com/photo/woman-wearing-teal-dress-sitting-on-chair-talking-to-man-2422280/" target="_blank">Pexels</a><br>
Cử chỉ tay và tư thế cơ thế là một phần quan trọng trong hội thoại. Jopwell/Pexels
Ta thiếu đi một vốn từ vựng phong phú tương tự cho việc mô tả những loại hình giao tiếp quan trọng đó mà ta có cho giao tiếp bằng ngôn từ thông qua thế giới học thuật của ngôn ngữ học. Nhưng nhà nhân học và học giả về ngôn ngữ cơ thể Ray Birdwhistell, người mà vào những năm 1940 và 1950 đã là một trong những người đầu tiên nghiên cứu nghiêm túc hành vi phi ngôn ngữ, đã đánh giá rằng “biểu lộ khuôn mặt, cử chỉ, tư thế và dáng đi, và chuyển động cánh tay hữu hình và các bộ phận cơ thể khác” đóng góp 65-70 % ý nghĩa xã hội của cuộc hội thoại.
Ngôn ngữ cơ thể trong cuộc trò chuyện có tính biểu cảm cao. Ta biết điều này. Chúng đưa ra các dấu hiệu về trạng thái cảm xúc, thái độ, lập trường về chủ đề, liệu người ta đang bối rối hay đang dõi theo, liệu họ đang hứng thú hay cảm thấy chán nản, họ phản hồi các ý tưởng của ta như thế nào, và nhiều thứ khác giúp ta có thể làm việc cùng nhau. Nhưng, mỉa mai thay, nhiều hướng dẫn trực tuyến khuyên ta che dấu những cử chỉ hay thậm chí khuyến khích phần trên cơ thể ta bất động. Ở nhiều trường hợp, mọi người tắt camera của họ đi hay chỉ sử dụng audio.
Vào một ngày tôi đang quan sát một cuộc gọi hội thảo audio giữa những người kĩ sư ở Houston và Romania. Chủ đề là sự thay đổi trong thiết kế hỗ trợ cho các nền tảng. Họ đều đi đến một thỏa thuận rõ ràng.
“ĐƯỢC RỒI!” Jeremy với một giọng rõ tiếng.
“Có lẽ-” Costa bắt đầu với một ý tưởng.
“Được rồi, nhưng-” Jeremy nhảy vào.
Costa tiếp tục nói trong khi Jeremy cố để ngắt lời.
“Thật khó để ngắt lời anh ta!” Bob ở Houston nói trong lúc cười. Anh ta sau đó can thiệp thay cho Jeremy. “Chờ một chút nào. Jeremy đang cố nói điều gì đó.”
Nhiều người lao động trực tuyến đang trải qua việc mọi người nói cùng một lúc như thế nào, rồi xin lỗi, rồi lại bắt đầu nói cùng một lúc. Người ta do dự trong việc nói bởi vì họ không muốn bị đưa vào một thế khó xử.
“Biểu lộ khuôn mặt, cử chỉ, tư thế và dáng đi, và chuyển động cánh tay hữu hình và bộ phận cơ thể khác,” nhà nhân học Ray Birdwhistell viết, chiếm đến 65-70% ý nghĩa xã hội của cuộc hội thoại.
Hầu hết mọi người chưa bao giờ nghĩ về việc thay phiên nhau hay sử dụng ánh nhìn ra sao và gật đầu, của riêng họ hay của người khác, để tạo điều kiện cho cuộc hội thoại trở nên dễ dàng. Những người mà nghiên cứu về thời gian trong tích tắc và sự phối hợp nhịp nhàng trong chuyển lượt, như các nhà phân tích hội thoại làm, mô tả cách cách các dấu hiệu trong tích tắc này hoạt động – một điều mà Goffman đã bàn về, từ ánh nhìn tới độ nghiêng cơ thể. Người ta thậm chí còn chú ý liệu ai đó hít vào theo một kiểu nhất định là khi họ muốn lấy lượt nói mà không làm gián đoạn những người khác. Đó là tất cả các dấu hiệu chỉ ra rằng, dù màn hình của ta có độ phân giải cao đến đâu, không dễ để tìm thấy trên mạng.
Những kĩ sư, đã nói với tôi họ thấy rất khó chịu bởi những thất bại liên tục của họ trong việc phối hợp những hành động chuyển lượt “đơn giản” trong những cuộc hội thoại của họ, một thất bại họ chưa từng trải qua trước đây, đến mức mà họ muốn thiết kế một nút chuyển lượt đặc biệt – một phiên bản công nghệ của gậy baton.
Một thiếu sót quan trọng thứ hai mà các kĩ sư đã trải qua đó là cái mà các nhà nhân học ngôn ngữ học gọi là “sự tham gia ngoại vi” (peripheral participation), ý tưởng lần đầu được phát triển bởi những người nghiên cứu các lý thuyết về sự học tập.
Thuật ngữ ngoại vi để chỉ trạng thái giảm bớt của một thứ (giống như “phi” trong phi ngôn ngữ), nhưng nó thực sự là một trong những khía cạnh quan trọng nhất của môi trường chuyên nghiệp. Sự tham gia ngoại vi đặc biệt quan trọng trong hướng dẫn và thúc đẩy tính hòa nhập, cũng như trong việc đảm bảo các thành viên trong một đội có cùng quan điểm.
Uống cafe cùng nhau là một cách thức truyền thống mà một vài nhân viên trao đổi các thông tin quan trọng và tạo ra bản đồ tinh thần về thứ “ai làm cái gì” trong một công ty.  Cydcor/<a href="https://www.flickr.com/photos/cydcor/15849366318/in/photolist-q9y9qw-6TM1kv-7zgFRo-7zgFD5-jpppM-7M7WKp-h9Zioc-h9Zd8o-C9QA4z-gTUJX8-gSp6Z3-h9Z1YZ-2hpsnue-aqgZeu-FKKW5q-gSoU3E-fzVEU4-ha1xNF-gSpHH6-gSpiej-2hVmfvE-2ho6wEr-gSoZ8E-gSoX7f-ha1v9T-h9Ze7W-fyMuZR-h9ZoGP-h9Zm7t-ha1LE2-h9YPLC-26hV8Ke-PLJa5o-QPYmYC-ha1TW6-h9Zx49-gSp4C1-h9YVwL-HufHs5-ai7pAx-xY19Hd-h9YU2n-ha1t3i-QtUFSL-bjVJUQ-6MyyRg-5R5wb6-6zRwBr-PPuGxn-2iPYsxh" target="_blank">Flickr</a>
Uống cafe cùng nhau là một cách thức truyền thống mà một vài nhân viên trao đổi các thông tin quan trọng và tạo ra bản đồ tinh thần về thứ “ai làm cái gì” trong một công ty. Cydcor/Flickr
(Chú thích người dịch: peripheral participation có thể hiểu như cái cách một người mới trở thành một thành viên có kinh nghiệm, một full participant trong một cộng đồng nào đó, nó xác định học tập như là một hiện tượng xã hội theo bối cảnh, đạt được thông qua việc tham gia các hoạt động cộng đồng. Những người mới đến sẽ tham gia vào các hoạt động với nhiệm vụ đơn giản và ít rủi ro để hòa nhập, làm quen với các quy tắc, vốn từ vựng, nhiệm vụ của từng cộng đồng… Qua đó, nhiều người mới khi đạt tới một mức hiểu biết nhất định sẽ biết rõ được môi trường mình ở bên trong và xây dựng lên cho bản thân một danh sách về các thành viên khác (mental map) với từng thông tin như ai biết cái gì, ai làm cái gì, ai sẽ hướng dẫn, ta phải làm việc với ai… Ví dụ như những buổi gặp mặt sau giờ học của sinh viên với giảng viên hay giữa các nhân viên trong văn phòng vào thời điểm nghỉ ngơi tại một số khu vực đặc thù như nhà ăn, hành lang…)
Trong một viện quốc tế nơi tôi từng là một nhà nghiên cứu, căn phòng nơi chúng tôi tìm thấy cà phê, trà và những chiếc bánh sinh nhật kì quặc còn sót lại đã được đổi tên thành Phòng Hội nghị tí hon (và một tấm biển đã được treo trên cửa để thông báo điều này). Đó là một sự thừa nhận rằng những cuộc trao đổi quan trọng đã diễn ra ở đó, bao gồm cả sự hướng dẫn căng thẳng trực tiếp đặc trưng cho việc học tập chuyên môn, mặc dù bề ngoài mọi người “chỉ” đang uống cà phê.
Khi những người mới vào nghề chuyển từ những người tham gia ngoại vi sang những người tham gia đầy đủ, họ phát triển những thư mục kiến thức “ai biết cái gì”. Nhưng sau khi chuyển sang môi trường làm việc phụ thuộc vào giao tiếp trực tuyến, những kĩ sư phải “chạy theo kiến thức”, như họ đã nói.
Những kĩ sư mà làm việc từ xa với những kĩ sư ở Mỹ đã nói, “Chúng tôi nhớ những thứ ở hành lang.” Andrei đã nói với tôi rằng khi anh ta dành thời gian ở Houston, anh ta có thể xây lên một bản đồ tinh thần về việc “ai biết cái gì”. Khi anh ấy quay trở lại Romania, bản đồ lỗi thời theo thời gian rất nhanh.
Trong thời đại dịch gần đây, những nỗ lực nhằm thúc đẩy những tương tác giữa những người lao động phải được tái tạo. Rất nhiều các văn phòng tiền Covid-19 có đầy đủ không gian cho những cuộc gặp gỡ tình cờ và phong phú không chỉ trong ngôn ngữ mà còn về các dấu hiệu cảm quan và ngữ cảnh. Những người lao động từ lâu đã coi những điều trên là đương nhiên. Đã đến lúc nhận ra những điều đó, không chỉ bởi sự thiếu vắng của chúng mà còn bởi sự thừa nhận tầm quan trọng của chúng.
Tôi là một nhà nhân học nghiên cứu về sự tương tác giữa con người, không phải một nhà phát triển CNTT, nhưng tôi có thể thấy rằng có những học viện và công ty ngoài kia đang theo đuổi các giải pháp công nghệ: các công cụ giao tiếp được đặt tên theo Watercooler và Hallway nhằm mục đích tạo điều kiện cho giao tiếp ngoại vi, và các phép chiếu video hay thực tế ảo nâng cao được thiết kế để khiến mọi người cảm thấy họ thực sự đã ở đó với những người khác.
Một vài nhà phát triển đã đề xuất một chiếc ghế nhạy cảm áp lực để ghi lại cách ta di chuyển cơ thể, kết nối những chuyển động này với các dấu hiệu hứng thú hay không hứng thú. Những dự án khác đã cho thấy rằng những hình đại diện sử dụng những cử chỉ cải thiện sự tương tác và giao tiếp trong hợp tác công việc – thậm chí cả khi những cử chỉ đó chỉ tình cờ được kích hoạt bởi người dùng.
Nhiều trong số những sự phát triển này thừa nhận rằng công nghệ sẽ không đạt được những gì ta muốn chúng đạt được nếu ta không giữ những bài học về con người ở trong tâm trí. Giao tiếp, sau tất cả, là về con người – không chỉ là lời nói mà còn là cử chỉ, cảm giác và bản đồ tinh thần. Nhưng vẫn có một quãng đường dài để kết hợp tất cả những điều này vào công việc ảo một cách trọn vẹn và hiệu quả.
*Tất cả tên của người được phỏng vấn đều được thay đổi để bảo đảm quyền riêng tư của mọi người