Date of Publication

3-2026

Document Type

Dissertation

Degree Name

Doctor of Philosophy in Philosophy

Subject Categories

Philosophy

College

College of Liberal Arts

Department/Unit

Philosophy

Defense Panel Member

Napoleon M. Mabaquiao, Jr.
Cesar J. Unson, Jr.
Lorenz Moises J. Festin
Krizna Rei M. Palces

Abstract (English)

The present work is a critique of the philosophical assumptions of Artificial Intelligence Safety Engineering. AI Safety Engineering is concerned with building safety mechanisms for machines using principles in the applied sciences and engineering. It generally presents itself as an alternative to Machine Ethics in addressing the challenges posed by future AI developments. Rather than pursuing the arguably problematic goal of making AI systems ethical, it emphasizes the more practical objective of ensuring the safety of these systems. However, whether it can successfully achieve this goal (i.e., avoid discussions about ethics) remains a matter of debate. This work focuses on its five key philosophical assumptions, which can be categorized into (A) the standard assumptions of AI Safety and (B) those drawn from the works of its pioneers. The standard assumptions of AI Safety are the following: (1) The complexity of ethics makes it incomputable, (2) computational machines cannot be ethical like people, and (3) computing machines can play the moral game. These may be considered standard assumptions because AI developers and thinkers have already identified them. On the other hand, those assumptions that can be drawn from the works of AI Safety pioneers are as follows: (4) Ethics is separable from safety measures and (5) Artificial General Intelligence research is unethical. Each of these philosophical assumptions was examined, and its foundational basis was uncovered. Ideas from other disciplines were also looked into to better understand each of these assumptions. Afterwards, key ethical and philosophical concepts and theories, as well as those from other research fields, were cited to challenge them, showing that they were not on solid ground.

 

Abstract Format

html

Abstract (Filipino)

Ang pag-aaral na ito ay isang kritikal na pagsusuri sa mga pilosopikal na pagpapalagay (philosophical assumptions) tungkol sa Artificial Intelligence Safety Engineering. Ang AI Safety Engineering ay nakatuon sa paggawa ng mga matatalinong artipakto na ligtas gamitin batay sa agham at inhenyeriya. Itinuturing na alternatibo ang AI Safety Engineering sa Machine Ethics sa pagtugon sa mga hamon na dulot ng pagpapalaganap ng AI. Sa halip na ituon ang pansin sa paggawa ng mga etikal na AI, binibigyang-diin nito ang mas praktikal na layunin: ang maging ligtas ang AI para sa lahat. Gayunpaman, nananatiling masalimuot at pinagtatalunan ngayon kung maaari ba itong makamit nang hindi isinasaalang-alang ang mga usaping etikal. Nakapokus ang pag-aaral na ito sa limang pangunahing pilosopikal na pagpapalagay ng AI Safety Engineering ayon sa mga sumusunod na kategorya: (A) mga karaniwang pananaw sa AI Safety at (B) mga pananaw mula sa mga naunang eksperto sa disiplinang ito. Ang mga karaniwang pagpapalagay sa AI Safety ay ang mga sumusunod: (1) masyadong komplikado ang etika kaya hindi ito kayang iprograma sa kompyuter, (2) ang kawalan ng kakayahan ng mga AI na maging etikal tulad ng tao, at (3) maaaring makibahagi ang AI sa mga sitwasyong may kinalaman sa tama at mali ngunit ito ay laro lamang (moral game). Itinuturing na karaniwan ang mga nabanggit na pananaw sapagkat malawakan na itong kinikilala at natukoy ng mga eksperto sa larangan ng AI Safety. Samantala, ang mga pananaw na nagmula sa mga nagtaguyod ng AI Safety ay ang mga sumusunod: (4) ang etika ay maaaring ihiwalay sa mga teknikal na hakbang sa kaligtasan (safety measures) at (5) hindi etikal ang pag-aaral at pagsusulong ng Artificial General Intelligence. Sinuri ng pag-aaral na ito ang mga pilosopikal na pagpapalagay ng AI Safety at tinukoy ang kanilang mga batayan. Sinipi rin nito ang mga ideya mula sa iba’t ibang disiplina upang higit na maunawaan ang mga nasabing pagpapalagay. Sa huli, ginamit ng pag-aaral na ito ang mga mahahalagang konsepto at teorya sa etika, pilosopiya, at iba pang larangan upang ipakita na hindi ganap na matibay ang kanilang mga pundasyon.

Abstract Format

html

Language

English

Format

Electronic

Keywords

Artificial intelligence; Engineering ethics; Industrial safety

Upload Full Text

wf_yes

Embargo Period

4-7-2029

Available for download on Saturday, April 07, 2029

Share

COinS