You are on page 1of 81

Teoria Axiomática de Conjuntos:

Uma Introdução
Marcelo Esteban Coniglio
GTAL, Departmento de Filosofia
Universidade Estadual de Campinas
P.O. Box 6133, 13081-970
Campinas, SP, Brazil
E-mail: coniglio@cle.unicamp.br

Abstract
O presente texto corresponde às notas de aula do curso HF005-Teoria
de Conjuntos, do Programa de Pós-Graduação em Filosofia da UNICAMP,
que ministrei no segundo semestre de 1997. Trata-se principalmente de
uma adaptação do livro Axiomatic Set Theory, de P. Suppes (Dover, 1972).
Alguns tópicos (principalmente, teoria de ordinais e de cardinais) foram
adaptados do livro Set Theory: an Introduction to Large Cardinals, de
F.R. Drake (North Holland, 1974).

Contents
Introdução 3

1 Teoria Cumulativa de Tipos 4

2 Axiomas Básicos da Teoria de Conjuntos 5

3 Axiomas Adicionais 9

4 Produtos Cartesianos 13

5 Relações em S 16

6 Relações de Ordem 19

7 Relações de Equivalência 24

8 Funções 29

9 Equipolência 33

10 Conjuntos Finitos 40

11 Axiomas Finais de ZF . O Axioma da Escolha 46

1
12 Introdução aos Ordinais 49

13 Indução e Recursão Transfinita 54

14 Aritmética Ordinal 62

15 Cardinais 73

2
Introdução
A Teoria de Conjuntos (TC) ocupa um lugar privilegiado dentre as disciplinas
da Matemática moderna: todas as entidades estudadas na matemática (com
algumas exceções) podem ser consideradas conjuntos. Portanto, as questões
acerca da natureza da matemática são basicamente questões acerca de conjun-
tos.
A TC foi iniciada a partir das pesquisas de Georg Cantor em 1870 sobre
a teoria das séries infinitas em Análise; a partir destes trabalhos, Cantor foi
levado a considerar conjuntos infinitos ou classes de caráter arbitrário. Mas
o que são os conjuntos? A nossa idéia intuitiva os define como coleções de
objetos. Segundo Cantor, “um conjunto é uma coleção, considerada como um
todo, de objetos distintos e definidos da nossa intuição ou pensamento. Os
objetos são chamados de elementos do conjunto”. Os paradoxos surgidos logo
no inı́cio do estudo da teoria mostraram que a concepção “ingênua” de Cantor
não podia formar uma base satisfatória para a TC, e muito menos para a
Matemática. Isto levou a uma reformulação dos princı́pios básicos da teoria.
Os paradoxos apareceram principalmente pelo uso indiscriminado das noções de
conjunto, número cardinal e ordinal, etc. Um paradoxo consiste na derivação no
sistema lógico de ϕ e ¬ϕ para alguma afirmação ϕ, ou então a derivação de uma
afirmação da forma ϕ ↔ ¬ϕ. O primeiro paradoxo foi descoberto pelo próprio
Cantor em 1895 e não foi publicado imediatamente, mas foi redescoberto por
Burali-Forti em 1897, que também não conseguiu fornecer uma solução. O
paradoxo surgiu com relação à teoria dos ordinais, num estágio relativamente
avançado da teoria, e não foi levado muito a sério. A aparição em 1902 do célebre
paradoxo de Russell fez mudar as coisas, pois ele surge no primeiro estágio da
teoria: dado que, pelo axioma de compreensão, podemos definir os conjuntos
{x : ϕ(x)}, onde ϕ(x) é uma fórmula denotando uma propriedade, então é
lı́cito formular o conjunto A = {x : x 6∈ x} (considerando ϕ(x) ≡def x 6∈ x).
Logo, podemos nos perguntar se é o caso que A ∈ A ou não é o caso que A ∈ A,
obtendo: A ∈ A sse A 6∈ A!! Este fato causou uma verdadeira revolução no
méio acadêmico ligado à fundamentação da matemática, obrigando Dedekind a
suspender a publicação do seu ensáio sobre a natureza dos números. Enquanto
isso, Frege acabara de publicar sua obra prima, fruto de décadas de esforços,
admitindo por fim que um dos pilares do seu edifı́cio tinha sido sacudido por
Russell.
Os paradoxos tem uma origem antiga: o exemplo clássico é o Paradoxo do
Mentiroso (Epimênides), que pode ser formulado simplesmente como: “Esta
frase é falsa”. É claro que supor a verdade ou a falsidade da frase leva a uma
contradição. O paradoxo de Grelling-Nelson (1908) diz o seguinte: defina como
heterológicos os adjetivos tais que eles mesmos não satisfazem a propriedade
que eles denotam. Por exemplo, “inglês”, “azul” ou “frio” são heterológicos,
enquanto que “polissilábico” ou “português” não o são; em sı́mbolos, dado
um adjetivo “S”, temos que “S” é heterológico sse “S” não é (não satisfaz) S.
Logo, “heterológico” é heterológico sse “heterológico” não é heterológico. O
paradoxo de Richard (1905) diz o seguinte: considere os números reais entre 0
e 1 que podem ser definidos por um número finito (não limitado) de palavras

3
em português: por exemplo, “ponto cinco”, “o maior número tal que elevado
ao quadrado e multiplicado por três é igual a dois”. Os números definidos desta
maneira podem ser enumerados (só temos uma quantidade enumerável de frases
de tamanho finito). Considere o seguinte número: “o número real entre 0 e 1
cuja n-ésima casa decimal é três se a n-ésima casa decimal do n-ésimo número é
cinco, e é cinco em caso contrário”. Logo, esta frase define um número diferente
de todos os números da lista, uma contradição (este paradoxo é baseado no
método diagonal de Cantor para provar que o conjunto dos números reais não
é enumerável). Ramsey distingue dois tipos de paradoxos: os semânticos e
os lógicos. Todos os paradoxos mencionados acima (com exceção do paradoxo
de Russell) são semânticos; dentre os paradoxos lógicos podemos mencionar o
paradoxo de Russell, o de Cantor e o de Burali-Forti. O paradoxo de Cantor
(1899) diz: considere U o conjunto de todos os conjuntos. Logo, o conjunto
P(U ) das partes de U tem cardinal estritamente maior do que o cardinal de
U , o que contradiz a hipótese de que U seja o maior conjunto. O paradoxo de
Burali-Forti (1897) diz: o conjunto bem ordenado W de todos os ordinais tem
um ordinal maior que todo elemento de W , portanto maior que todo ordinal.

1 Teoria Cumulativa de Tipos


Todos os paradoxos vistos têm a mesma origem: a auto-referência. No caso dos
paradoxos em TC, podemos solucionar o problema considerando que os conjun-
tos são formados em etapas ou estágios; assim, um conjunto só pode ser criado
a partir de conjuntos que já foram definidos ou criados anteriormente. Isto dá
origem à teoria simples de tipos:

Nı́vel 0: alguns indivı́duos (urelemente), sem propriedades especı́ficas.


Nı́vel 1: todas as coleções formadas por indivı́duos.
Nı́vel 2: todas as coleções formadas por elementos no nı́vel 1, etc.

Assim, se os indivı́duos são os números naturais, então 3 é um conjunto no


nı́vel 0, {1, 2} está no nı́vel 1, e {{2}, {4, 6}} está no nı́vel 2. As questões são:
(a) qual é o problema em considerar {1, {1}} como conjunto? (b) o conjunto
vazio ∅, assumindo que seja um indivı́duo, seria diferente nas diferentes etapas
em que pudesse aparecer? Com relação à (a), é óbvio que o modelo é restritivo
demais, logo consideramos a teoria cumulativa de tipos:

Nı́vel 0: alguns indivı́duos.


Nı́vel 1: todas as coleções formadas por indivı́duos.
Nı́vel 2: todas as coleções formadas por elementos no nı́vel 0 ou 1.
Em cada nı́vel, considerar as coleções cujos elementos estão em nı́veis
anteriores.

Logo, {1, {1}} aparece no nı́vel 2, no nosso exemplo. Com relação à (b), temos
que assumir que uma vez que um conjunto aparece num nı́vel, toda aparição
posterior é a mesma. As questões seguintes são: quantos indivı́duos deveriam

4
ser tomados? os nı́veis têm final? Com relação à primeira questão, parece
claro que ∅ deveria ser considerado o único indivı́duo; isto equivale a não tomar
indivı́duos (logo, ∅ será o único conjunto do nı́vel 1). Com relação à segunda
questão, a resposta é “não”. Se existisse um máximo nı́vel α, é claro que
poderiamos criar um nı́vel adicional α+1 com os conjuntos que temos definidos,
uma contradição.

2 Axiomas Básicos da Teoria de Conjuntos


A primeira axiomatização de TC foi dada por Zermelo em 1908, e modificada
por Fraenkel em 1922, dando origem ao sistema Zermelo-Fraenkel (ZF ). Ex-
istem muitos outros sistemas, como o de von Neumann-Gödel-Bernays (N GB)
e o de Kelley-Morse (KM ). Estes últimos usam classes juntamente com con-
juntos. Uma classe pode ser pensada como uma coleção “enorme”, de maneira
que os conjuntos viriam ser classes “pequenas”. Por exemplo,

V = {x : x = x}

é a coleção de todos os conjuntos, chamada de classe universal. V é uma


classe própria, isto é, ela não é um conjunto, portanto não aparece em nenhum
nı́vel da hierarquia cumulativa. Se todos os membros de uma classe aparecem
antes de um dado nı́vel, então a classe é um conjunto nesse nı́vel. Neste curso
estudaremos apenas ZF .
A formulações ZF de TC é realizada numa linguagem de primeira ordem,
utilizando constantes para os (eventuais) indivı́duos, duas relações binárias (=,
∈), os conectivos ∨, ∧, ¬, → , ↔ , e os quantificadores ∀ (para todo) e ∃
(existe), junto com um repertório enumerável de variáveis. As variáveis são
denotadas: a, b, . . . , x, y, z (com ou sem ı́ndices). Como é usual, as fórmulas
¬(x = y) e ¬(x ∈ y) serão denotadas por (x 6= y) e (x 6∈ y), respectivamente.
Começamos enunciando o primeiro axioma de ZF :

Axioma de Extensionalidade:

[A1] (∀z)(z ∈ x ↔ z ∈ y) → (x = y)

Aqui é evidenciada a intenção de que, quando uma coleção aparecer em dife-


rentes nı́veis, ela seja considerada como sendo a mesma; por outro lado, é
estabelecido que o que interessa com relação aos conjuntos são os seus e-
lementos, mais do que o que eles são. Observe que a implicação recı́proca
(x = y) → (∀z)(z ∈ x ↔ z ∈ y) é logicamente válida.

Axioma de Compreensão ou Separação:

[A2] (∃y)(∀x)(x ∈ y ↔ (x ∈ a ∧ ϕ(x)))

Isto significa que estamos “separando” alguns elementos de a, exatamente aque-


les que satisfazem a propriedade ϕ. Aqui, ϕ(x) é uma fórmula onde x aparece

5
livre, podendo aparecer outras variáveis livres em ϕ (os parâmetros do con-
junto criado), mas a variável y não aparece livre em ϕ. O axioma de
compreeensão tenta tomar, em cada estágio, todos os conjuntos já criados,
para formar os conjuntos do nı́vel seguinte. O axioma é limitado, pois só
tomamos os conjuntos formados pelas fórmulas ϕ. Observe que [A2] é um
axioma-esquema, isto é, cada fórmula ϕ determina um axioma. A condição
sobre y não ocorrer livre em ϕ está relacionada com a auto-referência, e é fun-
damental para evitar o paradoxo de Russell; caso contrário, podemos considerar
(∃a)(∀x)(x ∈ a ↔ x = b) (esta fórmula é demonstrável em ZF , como veremos
depois de incorporar outros axiomas) e ϕ(x, y) ≡def x 6∈ y em [A2]; logo, te-
remos: x ∈ y ↔ (x ∈ a ∧ x 6∈ y), e então x ∈ a → (x ∈ y ↔ x 6∈ y) para todo
x. Portanto, tomando a como acima, teremos: x = b → (x ∈ y ↔ x 6∈ y) para
todo x, donde, tomando b no lugar de x, obtemos b ∈ y ↔ b 6∈ y, contradição.
Como provaremos na Proposição 11.1, o axioma [A2] será dedutı́vel dos outros
axiomas de ZF (especificamente, [A2] é um caso particular do axioma [A7], a
ser introduzido na Seção 11). Porém, na primeira parte deste texto faremos um
uso pesado do axioma [A2] sem precisar usar por enquanto o axioma mais forte
[A7].
A partir de agora adotaremos a seguinte notação: {x : ϕ} é um (meta)termo
s em que toda ocorrência de x é limitada (ϕ é uma fórmula). Logo,

s = t denota (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ z = t);


t = s denota (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ t = z);
s ∈ t denota (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ z ∈ t);
t ∈ s denota (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ t ∈ z)

onde z não ocorre em ϕ nem em t.


Assim, por exemplo, se s ≡def {x : ϕ(x)} e t ≡def {x : φ(x)} então s ∈ t
denota a fórmula (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ z ∈ t). Por sua vez, z ∈ t denota a
fórmula (∃u)((∀x)(x ∈ u ↔ φ) ∧ z ∈ u), portanto s ∈ t denota a fórmula

(∃z)((∀x)(x ∈ z ↔ ϕ) ∧ (∃u)((∀x)(x ∈ u ↔ φ) ∧ z ∈ u)).

Se (∃y)(∀x)(x ∈ y ↔ ϕ(x)) é demonstrado a partir dos axiomas, dizemos que


{x : ϕ(x)} é legitimado. Logo, o axioma de separação diz que o (meta)termo

{x : x ∈ a ∧ ϕ(x)}

é legitimado. Note que este (meta)termo depende de a (e das variáveis diferentes


de x que ocorrem livres em ϕ(x)).

Observação 2.1 Se si ≡def {x : ϕi (x)} é legitimado (i = 1, . . . , n), então


(∀x1 ) · · · (∀xn )φ(x1 , . . . , xn ) implica φ(s1 , . . . , sn ), onde φ(s1 , . . . , sn ) é a ex-
pressão obtida de φ substituindo xi por si (eliminando a posteriori os si apli-
cando as regras de redução definidas acima). Portanto, se s ≡def {x : ϕ(x)} é
legitimado, então de x ∈ y ↔ φ(x) deduzimos s ∈ y ↔ (∃z)((∀x)(x ∈ z ↔ ϕ(x))∧
φ(z)) e s ∈ y ↔ φ(s) (lembrando que devemos eliminar s para obter fórmulas a
partir dessas expresões). 

6
Proposição 2.2 Suponha que s ≡def {x : ϕ(x)} é legitimado; logo, são demon-
stráveis:
x ∈ s ↔ ϕ(x), (s = y) ↔ (∀x)(x ∈ s ↔ x ∈ y) e
(s = y) ↔ (∀x)(x ∈ y ↔ ϕ(x)).

Demonstração: Sejam α ≡def (∃y)(∀x)(x ∈ y ↔ ϕ(x)) e β ≡def (∃y)((∀z)(z ∈


y ↔ ϕ(z))∧x ∈ y), isto é, β é x ∈ {x : ϕ(x)}; logo, α∧β implica β implica ϕ(x).
Por outro lado, ϕ(x)∧(x ∈ y ↔ ϕ(x)) implica x ∈ y, e então ϕ(x)∧α implica β.
Para provar a segunda equivalência, considere φ(z, y) ≡def (z = y) ↔ (∀x)(x ∈
z ↔ x ∈ y). Por [A1] vale (∀z)φ(z, y) e então, pela Observação 2.1 obtemos
φ(s, y), i.e., (s = y) ↔ (∀x)(x ∈ s ↔ x ∈ y). A última afirmação é uma con-
seqüência das duas primeiras. 

Desta maneira, se s ≡def {x : ϕ(x)} e t ≡def {x : φ(x)} são legitimados,


então, para provar (s = t), basta provar ϕ(x) ↔ φ(x).

Axioma do Conjunto Vazio:

[VZ] (∃y)(∀x)(x 6∈ y)

Este axioma é redundante, pois pode ser deduzido de [A2]: considere ϕ(x) ≡def
(x 6= x); como (x ∈ y ↔ (x ∈ a ∧ x 6= x)) ∼ (x 6∈ y ↔ (x 6∈ a ∨ x = x)) ∼ (x 6∈
y ↔ (x = x)) ∼ x 6∈ y, então o axioma [VZ] se segue por [A2]. Assim, o termo
{x : x 6= x}, que será denotado ∅, é legitimado em ZF . Note que (s = ∅) sse
(∀x)¬ϕ(x), se s ≡def {x : ϕ(x)}.

Corolário 2.3 [A1], [A2] ` x 6∈ ∅.

Demonstração: Pela Proposição 2.2,

` (∃y)(∀x)(x ∈ y ↔ x 6= x) → (x ∈ ∅ ↔ x 6= x)

(note que o antecedente desta implicação expressa que ∅ ≡def {x : x 6= x} é


legitimado). Logo, [V Z] ` (x ∈ ∅ ↔ x 6= x), donde [A1], [A2] ` x 6∈ ∅. 

Axioma do Par:

[PR] (∃y)(∀x)(x ∈ y ↔ ((x = a) ∨ (x = b)))

Este axioma afirma que existe o conjunto com a e b como únicos membros,
legitimando o termo {x : (x = a) ∨ (x = b)}, que será denotado {a, b} (note
que o nome do termo depende de a e b). Em função da hierarquia cumulativa,
o par {a, b} pode ser formado em qualquer estágio depois que a e b foram
formados; logo, não tem último estágio. O conjunto {a, a} será denotado {a},
sendo que contém a como único elemento. Este axioma é redundante, como
provaremos depois na Proposição 11.2. O axioma [PR] permitirá formar, junto
com o axioma [RF] da reunião finita a ser introduzido a seguir, os conjuntos
finitos da forma {a1 , . . . , an }.

7
Corolário 2.4 (a) [A1], [A2], [P R] ` x ∈ {a, b} ↔ (x = a) ∨ (x = b).
(b) [A1], [A2], [P R] ` x ∈ {a} ↔ x = a.
Adotemos a notação x ⊆ y e x ⊂ y para indicar as fórmulas

(∀z)(z ∈ x → z ∈ y) e (x ⊆ y) ∧ (x 6= y),

respectivamente. É claro que s ⊆ t ↔ (∀x)(ϕ(x) → φ(x)) se s ≡def {x : ϕ(x)}


e t ≡def {x : φ(x)} são legitimados.

Axioma da Reunião Finita:

[RF] (∃y)(∀x)(x ∈ y ↔ (x ∈ a ∨ x ∈ b))

Aqui estabelecemos que a ∪ b ≡def {x : (x ∈ a) ∨ (x ∈ b)} é legitimado. Este


axioma será redundante na presença dos outros axiomas, como provaremos na
Proposição 3.2. Por outro lado, a ∩ b ≡def {x : (x ∈ a) ∧ (x ∈ b)} é legitimado,
por [A2]. Logo, podemos provar o seguinte:
Proposição 2.5 (a ∪ b) ∩ c = (a ∩ c) ∪ (b ∩ c), e (a ∩ b) ∪ c = (a ∪ c) ∩ (b ∪ c).
Demonstração: x ∈ (a ∪ b) ∩ c sse x ∈ (a ∪ b) ∧ x ∈ c sse (x ∈ a ∨ x ∈ b) ∧ x ∈ c
sse (x ∈ a∧x ∈ c)∨(x ∈ b∧x ∈ c) see (x ∈ a∩c)∨(x ∈ b∩c) sse x ∈ (a∩c)∪(b∩c).
A outra afirmação é provada analogamente. 

Por [A2], a − b ≡def {x : (x ∈ a) ∧ (x 6∈ b)} é legitimado.


Proposição 2.6 a − (a ∩ b) = a − b.
Demonstração: x ∈ a−(a∩b) sse x ∈ a∧x 6∈ (a∩b) sse x ∈ a∧¬(x ∈ a∧x ∈ b)
see x ∈ a ∧ (x 6∈ a ∨ x 6∈ b) sse (x ∈ a ∧ x 6∈ a) ∨ (x ∈ a ∧ x 6∈ b) see x ∈ a ∧ x 6∈ b
see x ∈ a − b. 

Exercı́cios 2.7 Provar na TC obtida até agora o seguinte:


(1) x ⊆ x; (x ⊆ y ∧ y ⊆ x) → (x = y); (x ⊆ y ∧ y ⊆ z) → (x ⊆ z).
(2) ∅ ⊆ x; (x ⊆ ∅) → (x = ∅).
(3) ¬(x ⊂ x); (x ⊂ y) → ¬(y ⊂ x).
(4) a ∩ b e a − b são legitimados.
(5) a∩b = b∩a; (a∩b)∩c = a∩(b∩c); a∩∅ = ∅; a∩b ⊆ a; (a ⊆ b) ↔ (a∩b = a).
(6) (a ⊆ b) ↔ (a ∪ b = b); a ∪ ∅ = a; a ⊆ a ∪ b.
(7) a ∩ (a − b) = a − b; (a − b) ∪ b = a ∪ b; (a ∪ b) − b = a − b; a − (b ∪ c) =
(a − b) ∩ (a − c); a − (b ∩ c) = (a − b) ∪ (a − c); (a ⊆ b) → (a − b = ∅).
(8) Obter o paradoxo de Russell a partir de (∃y)(∀x)(x ∈ y).
(9) Opinar sobre a verdade ou falsidade das seguintes afirmações:
(9.1) O termo {x : x = x} não pode ser legitimado.
(9.2) ϕ(x) → x ∈ {x : ϕ(x)}.
(9.3) {x : x ∈ y} = y.
(9.4) (∀x)(ϕ(x) → φ(x)) → ({x : ϕ(x)} ⊆ {x : φ(x)}).
(9.5) (∀x)(ϕ(x) ↔ ¬φ(x)) → ({x : ϕ(x)} = {x : φ(x)}).

8
(10) Sejam s ≡def {x : ϕ(x)} e t ≡def {x : φ(x)} legitimados. Então
s ∈ t ↔ (∃w)((∀x)(x ∈ w ↔ ϕ(x)) ∧ φ(w)).
(11) x ∈ a ↔ {x} ⊆ a.

Observação 2.8 A partir das expressões obtidas na Proposição 2.2 e no E-


xercı́cio 2.7 (10), vemos que podemos iterar os termos {x : ϕ}, uma vez que
eles são legitimados. Assim, se os (meta)termos

si ≡def {x : φi (x)} (i = 1, . . . , n) e {x : ϕ(x, x1 , . . . , xn , z1 , . . . , zk )}

são legitimados então, usando a Proposição 2.2, {x : ϕ(x, z1 , . . . , zk )} é legi-


timado, onde ϕ é obtida de ϕ substituindo xi por si e , a posteriori, (w ∈ si ),
(si ∈ w), (si = w), (si ∈ sj ) e (si = sj ) pela expressão correspondente (w
é uma variável que ocorre livre ou limitada em ϕ). Por exemplo, os termos
a∪b ≡def {x : x ∈ a∨x ∈ b} e s ≡def {a} ≡ {x : x = a} são legitimados, logo
{a} ∪ b é legitimado, obtido como {x : x ∈ s ∨ x ∈ b} ≡ {x : x = a ∨ x ∈ b}.
Se, por outro lado, queremos formar {s1 } ∪ s2 , onde si ≡def {x : φi (x)} são
legitimados (i = 1, 2) então teremos t1 ≡def {s1 } ≡ {x : x = s1 } ≡ {x :
(∀y)(y ∈ x ↔ φ1 (x)}, logo t1 ∪ s2 ≡def {x : x ∈ t1 ∨ x ∈ s2 } ≡ {x : (∀y)(y ∈
x ↔ φ1 (x)) ∨ φ2 (x)}. É nesse sentido que devemos entender, por exemplo, o
(meta)termo (a ∪ b) ∩ c ≡def {x : x ∈ (a ∪ b) ∧ x ∈ c} ≡ {x : (x ∈ a ∨ x ∈
b) ∧ x ∈ c} na Proposição 2.5. 

3 Axiomas Adicionais
Nesta seção definiremos três axiomas adicionais da TC dada por ZF .

Axioma das Partes:

[A3] (∃y)(∀x)(x ∈ y ↔ (∀z)(z ∈ x → z ∈ a))

Este axioma garante en ZF que o conjunto {x : x ⊆ a} pode ser formado,


uma vez que a foi formado. A notação utilizada para este (meta)termo será
P(a). Como todo subconjunto de a será formado ao menos no nı́vel de a, então
P(a) aparecerá só no nı́vel seguinte. Logo, este axioma é verdadeiro na teoria
cumulativa de tipos, assumindo que não existe um máximo nı́vel.

Proposição 3.1 (1) a ∈ P(a); ∅ ∈ P(a) na TC introduzida até agora.


(2) Se s ≡def {x : φ(x)} e t ≡def {x : ϕ(x)} são legitimados em ZF , então
s ∈ P(t) sse s ⊆ t sse (∀x)(φ(x) → ϕ(x)); em particular, s ∈ P(s) e ∅ ∈ P(s).
(3) ZF ` P(∅) = {∅}.
(4) ZF ` P(P(∅)) = {∅, {∅}}.
(5) ZF ` a ⊆ b ↔ P(a) ⊆ P(b).
(6) ZF ` P(a) ∪ P(b) ⊆ P(a ∪ b).
(7) ZF ` P(a ∩ b) = P(a) ∩ P(b).
(8) ZF ` P(a − b) ⊆ (P(a) − P(b)) ∪ {∅}.

9
Demonstração: (1) a ∈ P(a) sse a ⊆ a. Pelo Exercı́cio 2.7 (10),

∅ ∈ P(a) ∼ (∃w)((∀x)(x ∈ w ↔ x 6= x) ∧ (∀x)(x ∈ w → x ∈ a)).

Logo, ∅ ∈ P(a) ∼ (∃w)((∀x)(x 6∈ w) ∧ (∀x)(x ∈ w → x ∈ a). Mas (∀x)(x 6∈ w)


implica (∀x)(x ∈ w → x ∈ a); portanto, pelo axioma do conjunto vazio obtemos
∅ ∈ P(a).
(2) Basta considerar ψ(x, y) ≡def (x ∈ P(y) ↔ x ⊆ y) e usar a Observação 2.1.
(3) P(∅) = {x : (∀y)(y ∈ x → y 6= y)} = {x : x = ∅} = {∅} (= {y : (∀z)(z 6∈
y)}).
(4) Por (3) temos que (y ∈ P(∅)) ↔ (∀z)(z 6∈ y). Assim,

P(P(∅)) = {x : (∀y)(y ∈ x → (∀z)(z 6∈ y))}


≡def {x : φ(x)}.
Por outro lado,

{∅, {∅}} = {x : x = ∅ ∨ x = {∅}}


= {x : (∀y)(y 6∈ x) ∨ (∀y)(y ∈ x ↔ (∀z)(z 6∈ y))}
≡def {x : ϕ(x)}.
Devemos provar então a equivalência de φ(x) e ϕ(x), as fórmulas que definem os
meta-termos P(P(∅)) e {∅, {∅}}, respectivamente. Partindo de ϕ(x), se assum-
imos α(x) ≡def (∃y)(y ∈ x) então obtemos φ(x), pois ϕ(x) ∼ (α(x) → φ(x)).
Assumindo ¬α(x) então também obtemos φ(x), porque nesse caso x = ∅, e
∅ ∈ P(s) para todo s legitimado, por (2). Assim,

ϕ(x), (x = ∅) ∨ (x 6= ∅) implica ψ,

portanto ϕ(x) implica φ(x), pelo Princı́pio do Terceiro Excluı́do. Analogamente


(analisando os casos em que x = ∅ ou x 6= ∅) provamos que φ(x) implica ϕ(x).
(5) Suponha que a ⊆ b, e seja x ∈ P(a). Se y ∈ x então y ∈ a, logo y ∈ b. Assim
y ∈ x implica y ∈ b, donde x ∈ P(b), isto é, P(a) ⊆ P(b). Reciprocamente,
suponha que P(a) ⊆ P(b). Como a ∈ P(a), então a ∈ P(b), donde a ⊆ b.
(6), (7) e (8): São deixados como exercı́cio. 

Axioma da Reunião:

[A4] (∃y)(∀x)(x ∈ y ↔ (∃z)((x ∈ z) ∧ (z ∈ a))

Este axioma legitima em ZF o meta-termo


[
a ≡def {x : (∃z)((x ∈ z) ∧ (z ∈ a))},
S
definindo a reunião da coleção de conjuntos a; os elementos de a são exata-
mente os elementos dos elementos de a. ComoSos elementos dos elementos de
a ocorrem em nı́veis anteriores ao de a, então a ocorre no nı́vel de a (e pos-
sivelmente no nı́vel anterior). Isto é válido na estrutura cumulativa de tipos.

10
ObserveS que, pelo axioma do par, existe {a, b}; logo, pelo axioma da reunião,
existe {a, b}. É fácil provar que este conjunto é exatamente a ∪ b. Vemos
assim que o axioma da reunião finita resulta agora redundante.
S
Proposição 3.2 (1) [A1], [PR], [A4] ` {a, b} = a ∪ b. Portanto, o axioma
[RF] é deduzido dos outros axiomas introduzidos até agora.
(2) Se s ≡def {x : φ(x)} e t ≡def {x : ϕ(x)} são legitimados então
[
{s, t} = s ∪ t = {x : φ(x) ∨ ϕ(x)}.

Demonstração: (1) Por definição,


S
{a, b} = {x : (∃z)(z ∈ {a, b} ∧ x ∈ z)}
= {x : (∃z)((z = a ∨ z = b) ∧ x ∈ z)}
= {x : (∃z)((z = a ∧ x ∈ z) ∨ (z = b ∧ x ∈ z))}
= {x : x ∈ a ∨ x ∈ b}
= a ∪ b.
S
(2) Considere ψ(a, b) ≡def (∀x)(x ∈ {a, b} ↔ x ∈ a ∪ b) (lembrando que
devemos eliminar os meta-termos para obter uma fórmula). Por (1) temos
(∀a)(∀b)ψ(a, b) e então, pela Observação 2.1, deduzimos ψ(s, t), pois s e t são
legitimados. 
Observe que, por [A2], sempre podemos definir a interseção de uma familia não
vazia de conjuntos:
Proposição 3.3 [A2], (∃x)(x ∈ a) ` (∃w)(∀x)(x
T ∈ w ↔ (∀y)(y ∈ a → x ∈ y)).
Em outras palavras, se a 6= ∅, então a ≡def {x : (∀y)(y ∈ a → x ∈ y)} é
legitimado.
Demonstração: Por [A2] temos que existe s = {x : x ∈ b ∧ (∀y)(y ∈
a → x ∈ y)}. Mas b ∈ a e (∀y)(y ∈ a → x ∈ y) implicam que x ∈ b, logo
s = {x : (∀y)(y ∈ a → x ∈ y)}. 

Provaremos algumas propriedades básicas da interseção e a reunião arbitrária


de conjuntos. Antes disso, precissamos ampliar a nossa notação permitindo
(meta)termos da forma {t : ϕ}, onde t é um (meta)termo da forma {x : φ}.
Definimos {t : ϕ} como sendo {x : (∃u1 ) · · · (∃un )((x = t) ∧ ϕ)} onde u1 ,
. . . , un são algumas das variáveis livres comuns a t e ϕ (no contexto ficará
claro quais variáveis serão livres, funcionando como parâmetros). Por exemplo,
podemos formar o termo s ≡def {a ∩ c : c ∈ b}, com variáveis livres a e b,
a partir do termo t ≡def a ∩ c (com variáveis livres a e c). Logo, s denota o
termo {x : (∃c)((x = a ∩ c) ∧ c ∈ b)}; aqui, c e b são as variáveis livres de
ϕ(c, b) ≡def c ∈ b. É imediato que se t é legitimado, então ϕ implica t ∈ {t : ϕ}.
Proposição
S 3.4 Na TC introduzida até agora temos o seguinte:
(1) S ∅ = ∅.
(2) {a} = a. S S
(3) Se s ≡def {x : φ(x)} é legitimado, então {s} = s; em particular, {∅} =
∅.

11
S S S
(4) T(a ∪ b) = ( a) ∪ ( b).
(5) {a, b} = a ∩ b. T
(6) Se s ≡def {x : φ(x)} e t ≡def {x : ϕ(x)} são legitimados, então {s, t} =
s ∩ t. T T T T
(7) Se a 6= ∅ e b 6= ∅,TentãoSexiste (a ∪ b), e (a ∪ b) = ( a) ∩ ( b).
(8) Se a S 6= ∅, então
S a ⊆ a.
(9) a ∩ ( b) = {a ∩ c : cT∈ b}. T T
(10) Se b 6= ∅, então existe {a ∪ c : c ∈ b}, e a ∪ ( b) = {a ∪ c : c ∈ b}.
S
Demonstração: (1) x ∈ S∅ sse (∃z)(x ∈ z ∧ z ∈ ∅) see (∃z)(x ∈ z ∧ z 6= z)
sse (∃z)(zS 6= z). Logo, x 6∈ ∅ para todo x.
(2) x ∈ {a} sse (∃z)(x ∈ z ∧ z ∈ {a}) sse (∃z)(x ∈ z ∧ z = a) S sse x ∈ a.
(3) É conseqüência de (2), considerando ψ(a) ≡def (∀x)(x ∈ {a} ↔ x ∈ a), a
Observação
S 2.1, e o fato de s ser legitimado.
(4) x ∈ (a ∪ b) sse (∃z)(x ∈ z ∧ z ∈ a ∪ b) sse (∃z)(x ∈ z ∧ (z ∈ a ∨ z ∈ b)) sse
(∃z)((x ∈Sz ∧z ∈Sa)∨(x ∈ z ∧z ∈ b)) sse (∃z)(x ∈ z ∧z ∈ a)∨(∃z)(x ∈ z ∧z ∈ b)
sse x ∈ (T a) ∪ ( b) (lembre que (∃z)(φ(z) ∨ ϕ(z)) ∼ (∃z)φ(z) ∨ (∃z)ϕ(z)).
(5) x ∈ {a, b} sse (∀y)(y ∈ {a, b} → x ∈ y) sse (∀y)((y = a ∨ y = b) → x ∈ y)
sse (∀y)((y = a → x ∈ y) ∧ (y = b → x ∈ y)) sse (∀y)(y = a → x ∈ y) ∧ (∀y)(y =
b → x ∈ y) sse x ∈ a ∧ x ∈ b sse x ∈ a ∩ b (lembre que (∀y)(φ(y) ∧ ϕ(y)) ∼
(∀y)φ(y) ∧ (∀y)ϕ(y)). T
(6) Considere ψ(a, b) ≡def (∀x)(x ∈ {a, b} ↔ x ∈ x ∈ a ∩ b). Por (5),
vale (∀a)(∀b)ψ(a, b), donde deduzimos ψ(s, t) para s e t legitimados, pela Ob-
servação 2.1.
(7) A prova é similar à do item (5).
(8) É imediato.
S
(9) x ∈ {a ∩ c : c ∈ b} sse (∃z)(x ∈ z ∧ (∃c)(z = (a ∩ c) ∧ c ∈ b) sse (∃c)(x ∈
(a ∩ c) ∧ c ∈Sb) sse (∃c)((x ∈ a ∧ (x ∈ c ∧ c ∈ b)) sse x ∈ a ∧ (∃c)(x ∈ c ∧ c ∈ b)
sse x ∈ a ∩ ( b) (lembre que (∃c)(ϕ ∧ φ(c)) ∼ ϕ ∧ (∃c)φ(c) se c não ocorre livre
em ϕ). T T
(10) x ∈ a ∪ ( b) sse x ∈ a ∨ (∀c)(c ∈ b → x ∈ c). Por outro lado, x ∈ {a ∪ c :
c ∈ b} sse (∀y)(yT ∈ {a ∪ c : c ∈ b} → x ∈ y).
Seja x ∈ a ∪ ( b) e y ∈ {a ∪ c : c ∈ b}; logo, existe c0 ∈ b tal que y = a ∪ c0 .
Se x ∈ a, então x ∈ (a ∪ c0 ) = y. Se (∀c)(c ∈ b → x ∈ c), então, tomando c0
0
no lugar de T c, obtemos x ∈ c e então x ∈ y. Em todo caso, provamos T que
x ∈ a ∪ ( b) T implica y ∈ {a ∪ c : c ∈ b} → x ∈ y, donde T x ∈ a ∪ ( b)
implica x ∈ {a ∪ c : c ∈ b}. Reciprocamente, seja x ∈ {a ∪ c : c ∈ b}, e
c ∈ b. Como a ∪ c ∈ T {a ∪ c : c ∈ b}, então x ∈ a ∪ c, donde x ∈ a ∨ x ∈ c.
Desta maneira, x ∈ {a ∪ c : c ∈ b} implica T c ∈ b → (x ∈ a ∨ x ∈ c) e
então x ∈ a ∨ (c ∈ b → x ∈ c). Portanto, x ∈ {a ∪ c : c ∈ b} implica
(∀c)(x ∈ a ∨ (c ∈ b → x ∈ c)) que implica x ∈ a ∨ (∀c)(c ∈ b → x ∈ c) (lembre
que (∀c)(α ∨ β(c)) ∼ α ∨ (∀c)β(c), se c não ocorre livre em α). 

Finalmente formularemos o axioma da regularidade. Este axioma, devido a Zer-


melo (1930) (existe uma versão prévia de von Neumann em 1925) é fundamental

12
para evitar situações da forma x ∈ x ou, em geral,
x1 ∈ x2 ∈ · · · ∈ xn ∈ x1 .
Além disso, este axioma evita “descensos infinitos” da forma
· · · ∈ xn ∈ xn−1 ∈ · · · ∈ x2 ∈ x1
(isto significa que a relação x ∈ y é bem fundada, como estudaremos depois).

Axioma da Regularidade:

[A5] (∃y)(y ∈ x) → (∃y)(y ∈ x ∧ (∀z)¬(z ∈ x ∧ z ∈ y))

Este é o único axioma expressando a idéia que os conjuntos ocorrem en nı́veis


ou tipos, e é precisso utilizar a teoria cumulativa de tipos para entendé-lo. Com
efeito, consideremos um conjunto x não vazio. Comecemos a analizar os nı́veis
de baixo para cima, até encontrar o primeiro nı́vel em que foram formados
elementos de x. Por exemplo, se x = {{∅}, {{∅}}, {{{∅}}}}, então o primeiro
nı́vel em que aparecem elementos de x é o nı́vel 2, assumindo que não temos
indivı́duos. Assim se y ∈ x está no nı́vel mı́nimo, então os elementos de y (se
existirem) devem necessariamente ter sido criados em nı́veis anteriores, logo não
podem pertencer a x, isto é: y ∩x = ∅ (o que se confirma no nosso exemplo). Os
axiomas de extensionalidade e regularidade são os únicos que exigem conjuntos
satisfazendo certas propriedades; os outros axiomas estabelecem a existência de
suficientes conjuntos em alguma direção.

Definição 3.5 S é o sistema axiomático da TC que consiste dos axiomas [A1]-


[A5] mais [PR].

Proposição 3.6 (1) S ` a 6∈ a.


(2) S ` ¬(a ∈ b ∧ b ∈ a).

Demonstração: (1) a ∈ a implica a ∈ {a} ∩ a. Por [A5] existe x ∈ {a} tal


que {a} ∩ x = ∅. Mas x ∈ {a} sse x = a e então {a} ∩ a = ∅, o que contradiz
a ∈ {a} ∩ a.
(2) Se a ∈ b ∧ b ∈ a, então a ∈ {a, b} ∩ b e b ∈ {a, b} ∩ a. Por [A5] existe
x ∈ {a, b} tal que {a, b} ∩ x = ∅. Mas x ∈ {a, b} sse x = a ou x = b. Os dois
casos levam a uma contradição. 
A partir de agora, desenvolveremos um estudo da TC obtida através do sis-
tema S. O sistema completo ZF da TC será introduzido na Seção 11. Porém, é
importante observar que uma parte interessante da TC “finita” pode ser desen-
volvida utilizando apenas o sub-sistema S de ZF , como veremos nas próximas
seções.

4 Produtos Cartesianos
Estamos em condições de começar a desenvolver as primeiras aplicações do
fragmento S de ZF introducido até agora. Antes de estudar a teoria de relações

13
e funções na próxima seção, é necessário definir o conceito de par ordenado, a
partir do qual são introduzidos os produtos cartesianos de conjuntos.

Definição 4.1 (Kuratowski) (i) ha, bi ≡def {{a}, {a, b}}.


(ii) ha1 , . . . , an+1 i ≡def hha1 , . . . , an i, an+1 i para n ≥ 2.

É claro que o axioma [PR] assegura a existência de ha, bi para todo a e b. Ob-
serve que a definição de ha, b, ci como sendo {{a}, {a, b}, {a, b, c}} não funciona
(porqué?).

Proposição 4.2 S ` ha, bi = hc, di ↔ (a = c) ∧ (b = d).

Demonstração: x ∈ ha, bi sse x = {a} ou x = {a, b}, e x ∈ hc, di sse x = {c}


ou x = {c, d}. Suponha que ha, bi = hc, di; a prova de que a = c e b = d será
feita por análise de casos.
Caso 1: a = b. Logo, ha, bi = {{a}} = {{c}, {c, d}} e então, pelo Corolário 2.4,
{c} = {a} = {c, d} donde, usando novamente o Corolário 2.4, obtemos que
c = a = d.
Caso 2: a 6= b. Dado que {a} ∈ hc, di, então {a} = {c} ou {a} = {c, d} (usando
o Corolário 2.4).
Caso 2.a: {a} = {c}. Logo a = c, e então hc, di = {{a}, {a, d}}. Como
{a, b} ∈ hc, di e {a, b} 6= {a} (pelo Corolário 2.4 e a hipótese a 6= b), então
{a, b} = {a, d}. Daqui obtemos, de a 6= b, que b = d.
Caso 2.b: {a} = {c, d}. Logo c = a = d e então hc, di = {{a}}. Mas
{a, b} ∈ hc, di, donde {a, b} = {a}, e então a = b, o que contradiz a hipótese
a 6= b. Daqui inferimos que vale o caso 2.a.
Claramente, a = c, b = d implica ha, bi = hc, di, pelas regras da igualdade. 

Uma vez que possuimos a definição de par ordenado, podemos criar o con-
junto de todos os pares ordenados hx, yi, onde x ∈ a e y ∈ b, fixados a e b.

Definição 4.3 O produto cartesiano de a e b é dado por a × b ≡def {hx, yi :


x ∈ a ∧ y ∈ b}.

Provaremos agora que o termo a × b é legitimado.

Proposição 4.4 a × b = {x : x ∈ P(P(a ∪ b)) ∧ (∃y)(∃z)(x = hy, zi ∧ (y ∈


a) ∧ (z ∈ b))}. Portanto, a × b é legitimado por [A2] (dado que os termos
envolvidos na definição são legitimados pelos outros axiomas de S).

Demonstração: Temos que {x : x ∈ P(P(a ∪ b)) ∧ (∃y)(∃z)(x = hy, zi ∧ (y ∈


a) ∧ (z ∈ b))} é legitimado por [A2]. Provaremos em S que
(∃y)(∃z)(x = hy, zi ∧ (y ∈ a) ∧ (z ∈ b)) →
→ x ∈ P(P(a ∪ b)) ∧ (∃y)(∃z)(x = hy, zi ∧ (y ∈ a) ∧ (z ∈ b))
e então (dado que a implicação recı́proca é sempre verdadeira) teremos provado
o resultado. Seja então x = hy, zi tal que y ∈ a, z ∈ b. Portanto, {y} ⊆ a ∪ b
e {y, z} ⊆ a ∪ b, donde {y} ∈ P(a ∪ b) e {y, z} ∈ P(a ∪ b). Desta maneira,
x = {{y}, {y, z}} ⊆ P(a ∪ b) e então x ∈ P(P(a ∪ b)). 

14
Proposição 4.5 S ` a × b = ∅ ↔ a = ∅ ∨ b = ∅.
Demonstração: Suponha que a × b = ∅. Assuma que ¬(a = ∅ ∨ b = ∅), isto
é, a 6= ∅ e b 6= ∅. Logo, (∃y)(y ∈ a) e (∃z)(z ∈ b). Daqui hy, zi ∈ a × b, uma
contradição. Portanto, inferimos que a = ∅ ∨ b = ∅. Reciprocamente, suponha
que a = ∅ ∨ b = ∅; logo, ¬(∃y)(y ∈ a) ∨ ¬(∃z)(z ∈ b) e então ¬(∃y)(∃z)((y ∈
a) ∧ (z ∈ b) ∧ x = hy, zi) para todo x. Portanto, x 6∈ a × b para todo x, donde
a × b = ∅. 

Proposição 4.6 S ` a × b = b × a ↔ (a = ∅ ∨ b = ∅ ∨ a = b).


Demonstração: Suponha que a × b = b × a; assumindo a 6= ∅, b 6= ∅ e a 6= b
provaremos uma contradição. Com efeito, de a 6= b inferimos que existe x ∈ a,
x 6∈ b ou existe x ∈ b, x 6∈ a, por [A1]. Assumamos x ∈ a, x 6∈ b (o raciocı́nio
para a outra possibilidade é simétrico). Seja y ∈ b (assumimos b 6= ∅). Portanto,
hx, yi ∈ a × b = b × a, e então (x ∈ b) ∧ (y ∈ a), donde x ∈ b, uma contradição.
Reciprocamente, suponha que (a = ∅∨b = ∅∨a = b). Temos que (a = ∅∨b = ∅)
implica a × b = ∅ = b × a, pela Proposição 4.5. Por outro lado, a = b implica
a × b = b × a, pelas regras da igualdade. 

Proposição 4.7 (i) S ` (a 6= ∅ ∧ a × b ⊆ a × c) → (b ⊆ c).


(ii) S ` (b ⊆ c) → (a × b ⊆ a × c).
Demonstração: (i) O caso b = ∅ é trivial. Assuma então b 6= ∅ e seja y ∈ b.
Fixe x ∈ a (assumimos a 6= ∅); logo hx, yi ∈ a × b, e a × b ⊆ a × c, donde
hx, yi ∈ a × c. Daqui (x ∈ a) ∧ (y ∈ c), e então y ∈ c; isto é, b ⊆ c.
(ii) O caso a × b = ∅ é trivial. Seja z ∈ a × b; logo, z = hx, yi para x ∈ a e y ∈ b.
Mas b ⊆ c, donde y ∈ c e então z = hx, yi ∈ a × c. Portanto a × b ⊆ a × c. 

Proposição 4.8 (i) S ` a × (b ∩ c) = (a × b) ∩ (a × c).


(ii) S ` a × (b ∪ c) = (a × b) ∪ (a × c).
(iii) S ` a × (b − c) = (a × b) − (a × c).
Demonstração: (i) hx, yi ∈ a × (b ∩ c) sse (x ∈ a) ∧ (y ∈ (b ∩ c)) sse (x ∈
a) ∧ ((y ∈ b) ∧ (y ∈ c)) sse ((x ∈ a) ∧ (y ∈ b)) ∧ ((x ∈ a) ∧ (y ∈ c)) sse
(hx, yi ∈ a × b) ∧ (hx, yi ∈ a × c) sse hx, yi ∈ (a × b) ∩ (a × c).
(ii), (iii): São deixados como exercı́cio. 

Proposição 4.9 S ` (a ⊆ a × a) → a = ∅.
Demonstração: Se z ∈ a então, de a ⊆ a × a, inferimos
z = {{x}, {x, y}} ∈ a × a para algum x, y ∈ a. (∗)
S
Suponha então S a 6= ∅. Pelo axioma deS regularidade aplicado a a ∪ ( a) 6= ∅,
existeSc ∈ a ∪ ( a) tal que c ∩ (a ∪ ( a)) = ∅. Observe que os elementos de
a ∪ (S a) são conjuntos não vazios, por (∗). Daqui, c 6= ∅. SSe c ∈ a, então
c ⊆ a (isto é uma conseqüência imediata
S da definição de a, e S é deixado
S Daqui ∅ =
como exercı́cio). 6 c = c ∩ ( a), o que contradiz c ∩ (a ∪ ( a)) = ∅.
Portanto c ∈ a donde, por (∗), teremos que c = {x} ou c = {x, y} para
x, y ∈ a. Nos dois casos c ∩ a 6= ∅, uma contradição. 

15
5 Relações em S
Nesta seção trataremos a teoria elementar de relações em S, utilizando os re-
sultados sobre produtos cartesianos provados na seção anterior.
Definição 5.1 Introduzimos as notações seguintes:
rel(r) para (∀x)(x ∈ r → (∃y)(∃z)(x = hy, zi))
“r é uma relação (um conjunto de pares ordenados)”;
u r v para hu, vi ∈ r
“u está em relação r com v”;
dom(r) para {x : (∃y)(x r y)}
(o domı́nio de r);
im(r) para {y : (∃x)(x r y)}
(a imagem de r);
r|z para {u : u ∈ r ∧ (∃x)(∃y)(u = hx, yi ∧ x ∈ z)}
(r com domı́nio restrito a z);
−1
r para {u : (∃x)(∃y)(u = hx, yi ∧ y r x)}
(a relação inversa de r);
r“z para {y : (∃x)(x ∈ z ∧ x r y)}, isto é, im(r|z)
(a imagem de z por r);
r(z) para {y : (∃u)((∀w)(z r w ↔ w = u) ∧ y ∈ u)}
(o único valor de r em z, se existir, ou ∅ em caso contrário).

Proposição 5.2 (a) (rel(r) ∧ (s ⊆ r)) → rel(s); em particular, rel(∅).


(b) (rel(r) ∧ rel(s)) → rel(r ∪ s) ∧ rel(r ∩ s) ∧ rel(r − s).

Demonstração: (a) z ∈ s implica z ∈ r implica z = hx, yi para algum x e y;


logo, rel(s).
(b) z ∈ r ∪ s implica z ∈ r ou z ∈ s; nos dois casos, z = hx, yi para algum x, y.
Os outros casos são similares. 

Proposição 5.3 Os meta-termos da Definição 5.1 são legitimados.


SS
Demonstração: dom(r): Por S [A2],
S existe {x : x ∈ r ∧ (∃y)(x r y)}.
Provaremos que a condição x ∈ r pode ser eliminada. Com efeito, suponha
S
que (∃y)(xSrSy). Logo hx, yi ∈ r, isto é, {{x}, {x, y}} ∈ r. Daqui {x} ∈ r e
então x ∈ r.
im(r): A prova é análoga à anterior.
r|z: É legitimado por [A2].
r−1 : Por [A2] existe {u : u ∈ im(r) × dom(r) ∧ (∃x)(∃y)(u = hx, yi ∧ y r x)}.
Provaremos que a condição u ∈ im(r)×dom(r) é implicada pela outra condição.
Seja então u satisfazendo: (∃x)(∃y)(u = hx, yi ∧ y r x). Logo, u = hx, yi tal
que y r x, donde y ∈ dom(r) e x ∈ im(r), e então u = hx, yi ∈ im(r) × dom(r).
r“z: Temos que r“z = im(r|z), S sendo portanto legitimado.
r(z): Por [A2], existe {y : y ∈ im(r) ∧ (∃u)((∀w)(z r S w ↔ w = u) ∧ y ∈ u)}.
Como antes, veremos que a condição de separação y ∈ im(r) é redundante.
Com efeito, suponha que y satisfaz (∃u)((∀w)(z r w ↔ w = u) ∧ y ∈ u), e seja

16
u satisfazendo (∀w)(z r w ↔ w = u) ∧ y ∈ u. Tomando
S w = u obtemos que z
r u, donde u ∈ im(r). Mas y ∈ u, portanto y ∈ im(r). 

Proposição 5.4 (a) dom(r ∪ s) = dom(r) ∪ dom(s).


(b) dom(r ∩ s) ⊆ dom(r) ∩ dom(s).
(c) dom(r) − dom(s) ⊆ dom(r − s).
(d) im(r ∪ s) = im(r) ∪ im(s).
(e) im(r ∩ s) ⊆ im(r) ∩ im(s).
(f ) im(r) − im(s) ⊆ im(r − s).

Demonstração: (a) Temos que x ∈ dom(r ∪ s) sse (∃y)(x (r ∪ s) y) sse (∃y)((x


r y) ∨ (x s y)) sse (∃y)(x r y) ∨ (∃y)(x s y) sse x ∈ dom(r) ∨ x ∈ dom(s) sse
x ∈ dom(r) ∪ dom(s).
(b)-(f): As provas são análogas, e são deixadas como exercı́cio. 

Com relação a r−1 temos as seguintes propriedades:

Proposição 5.5 (a) (r−1 )−1 ⊆ r; rel(r) → r ⊆ (r−1 )−1 .


(b) (r ∪ s)−1 = r−1 ∪ s−1 .
(c) (r ∩ s)−1 = r−1 ∩ s−1 .
(d) (r − s)−1 = r−1 − s−1 .

Demonstração: (a) z ∈ (r−1 )−1 implica que z = hx, yi tal que x (r−1 )−1
y. Mas x (r−1 )−1 y implica y r−1 x implica x r y, isto é, z = hx, yi ∈ r.
Reciprocamente, se rel(r), seja z ∈ r; então z = hx, yi tal que x r y, e a prova
é como acima, revertendo as implicações.
(b) hx, yi ∈ (r ∪ s)−1 sse hy, xi ∈ r ∪ s sse (hy, xi ∈ r) ∨ (hy, xi ∈ s) sse
hx, yi ∈ r−1 ∨ hx, yi ∈ s−1 see hx, yi ∈ r−1 ∪ s−1 .
(c) Análoga à prova anterior.
(d) hx, yi ∈ (r − s)−1 sse hy, xi ∈ r − s sse (hy, xi ∈ r) ∧ (hy, xi 6∈ s) sse
hx, yi ∈ r−1 ∧ hx, yi 6∈ s−1 see hx, yi ∈ r−1 − s−1 . 

Definição 5.6 A composição de r e s é definida como

r ◦ s ≡def {hx, yi : (∃z)((x r z) ∧ (z s y))}.

Proposição 5.7 r ◦ s é legitimado em S.

Demonstração: Provaremos que

r ◦ s = {u : u ∈ dom(r) × im(s) ∧ (∃x)(∃y)(∃z)((u = hx, yi) ∧ (x r z) ∧ (z s y))},

donde o resultado segue por [A2]. Assim, suponha que u = hx, yi tal que x
r z, z s y para algum z. Logo x ∈ dom(r) e y ∈ im(s), donde u = hx, yi ∈
dom(r) × im(s). 

A composição satisfaz as seguintes propriedades:

17
Proposição 5.8 (a) r ◦ (s ∪ t) = (r ◦ s) ∪ (r ◦ t).
(b) r ◦ (s ∩ t) ⊆ (r ◦ s) ∩ (r ◦ t).
(c) (r ◦ s) − (r ◦ t) ⊆ r ◦ (s − t).
(d) (r ◦ s)−1 = s−1 ◦ r−1 .
(e) r ◦ (s ◦ t) = (r ◦ s) ◦ t

Demonstração: (a) Temos que

x (r ◦ (s ∪ t)) y
see (∃z)((x r z) ∧ (z (s ∪ t) y))
see (∃z)((x r z) ∧ ((z s y) ∨ (z t y)))
see (∃z)(((x r z) ∧ (z s y)) ∨ ((x r z) ∧ (z t y)))
see (∃z)((x r z) ∧ (z s y)) ∨ (∃z)((x r z) ∧ (z t y))
see (x (r ◦ s) y) ∨ (x (r ◦ t) y)
see x ((r ◦ s) ∪ (r ◦ t)) y.

(b) Temos que

x (r ◦ (s ∩ t)) y
implica (∃z)((x r z) ∧ (z (s ∩ t) y))
implica (∃z)((x r z) ∧ ((z s y) ∧ (z t y)))
implica (∃z)(((x r z) ∧ (z s y)) ∧ ((x r z) ∧ (z t y)))
implica (∃z)((x r z) ∧ (z s y)) ∧ (∃z)((x r z) ∧ (z t y))
implica (x (r ◦ s) y) ∧ (x (r ◦ t) y)
implica x ((r ◦ s) ∩ (r ◦ t)) y,

lembrando que (∃z)(φ ∧ ψ) → ((∃z)φ ∧ (∃z)ψ). A recı́proca desta propriedade


lógica não é verdadeira em geral, donde não vale em geral a igualdade em (b).
(c) A prova é análoga à anterior.
(d) x (r ◦ s)−1 y sse y (r ◦ s) x sse (∃z)((y r z) ∧ (z s x)) sse (∃z)((z r−1 y) ∧ (x
s−1 z)) sse x (s−1 ◦ r−1 ) y.
(e) É deixada como exercı́cio. 

A restrição satisfaz as seguintes propriedades:

Proposição 5.9 (a) r|z = r ∩ (z × im(r)).


(b) r|(a ∩ b) = (r|a) ∩ (r|b).
(c) r|(a ∪ b) = (r|a) ∪ (r|b).
(d) r|(a − b) = (r|a) − (r|b).
(e) (r ◦ s)|a = (r|a) ◦ s.

Demonstração: Exercı́cio. 

Finalmente, a imagem r“z satisfaz as seguintes propriedades:

Proposição 5.10 (a) r“(a ∪ b) = r“a ∪ r“b.


(b) r“(a ∩ b) ⊆ r“a ∩ r“b.

18
(c) r“a − r“b ⊆ r“(a − b).
(d) (a ⊆ b) → (r“a ⊆ r“b).
(e) (r“a = ∅) ↔ (dom(r) ∩ a = ∅).

Demonstração: (a) Temos que


y ∈ r“(a ∪ b)
sse (∃x)((x r y) ∧ (x ∈ a ∪ b))
sse (∃x)((x r y) ∧ (x ∈ a)) ∨ (∃x)((x r y) ∧ (x ∈ b))
sse (y ∈ r“a) ∨ (y ∈ r“b)
sse y ∈ (r“a ∪ r“b).
(b) A prova é análoga, usando agora (∃x)(φ ∧ ψ) → ((∃x)φ ∧ (∃x)ψ).
(c) Análoga à anterior.
(d) y ∈ r“a implica (∃x)((x r y) ∧ (x ∈ a)) implica (∃x)((x r y) ∧ (x ∈ b))
implica y ∈ r“b.
(e) y ∈ r“a implica (∃x)((x r y) ∧ (x ∈ a)). Portanto, se (x r y) ∧ (x ∈ a), então
x ∈ dom(r) ∩ a. Isto é, r“a 6= ∅ implica dom(r) ∩ a 6= ∅. Reciprocamente, se
x ∈ dom(r)∩a, então x r y para algum y, e x ∈ a, donde (∃x)((x r y)∧(x ∈ a)).
Portanto y ∈ r“a, isto é: dom(r) ∩ a 6= ∅ implica r“a 6= ∅. 

Exemplo 5.11 Assumindo os números naturais como indivı́duos, sejam

r = {h1, 2i, h1, 3i, h2, 1i, h2, 3i}, s = {h2, 1i, h3, 5i}.

Portanto,

dom(r) = {1, 2}, im(r) = {1, 2, 3},


r“({1}) = {2, 3}, r“({3}) = ∅,
s−1 = {h1, 2i, h5, 3i}, r ◦ s = {h1, 1i, h1, 5i, h2, 5i},
s ◦ r = {h2, 2i, h2, 3i}, r|{2} = {h2, 1i, h2, 3i},
im(r|{2}) = {1, 3} = r“{2}, (r−1 )“{3} = {1, 2}. 

6 Relações de Ordem
Um tipo muito importante de relações é a classe das relações de ordem. Elas
ocorrem em quase todas as áreas da matemática, sendo que o seu estudo cons-
titui, em si, uma área relevante dentro da Matemática.

Definição 6.1 Introduzimos as notações seguintes:


ref (r, a) para (∀x)(x ∈ a → (x r x))
(r é reflexiva em a);
irr(r, a) para (∀x)(x ∈ a → ¬(x r x))
(r é irreflexiva em a);
sim(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a) ∧ (x r y)) → (y r x))
(r é simétrica em a);
asim(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a) ∧ (x r y)) → ¬(y r x))
(r é asimétrica em a);

19
anti(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a) ∧ (x r y) ∧ (y r x)) → (x = y));
(r é antisimétrica em a);
tran(r, a) para
(∀x)(∀y)(∀z)(((x ∈ a) ∧ (y ∈ a) ∧ (z ∈ a) ∧ (x r y) ∧ (y r z)) → (x r z))
(r é transitiva em a);
con(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a) ∧ (x 6= y)) → ((x r y) ∨ (y r x)))
(r é conectada em a);
f con(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a)) → ((x r y) ∨ (y r x)))
(r é fortemente conectada em a).

As definições usuais (r é reflexiva, r é simétrica, etc.) são obtidas considerando


a = dom(r)∪im(r) ≡def F (r); assim, ref (r) denota ref (r, F (r)), sim(r) denota
sim(r, F (r)), etc. Será muito útil definir a relação identidade sobre um conjunto
a, dada pelo termo I(a) = {hx, xi : x ∈ a}.

Proposição 6.2 O termo I(a) é legitimado em S.

Demonstração: O termo s ≡def {z : z ∈ PP(a) ∧ (∃x)(z = hx, xi ∧ (x ∈ a))}


é legitimado por [A2]. Basta então provar que (∃x)(z = hx, xi∧(x ∈ a)) implica
z ∈ PP(a). Com efeito, z = hx, xi implica z = {{x}}. Por outro lado, x ∈ a
implica {x} ∈ P(a), portanto z ⊆ P(a), isto é, z ∈ PP(a). Logo I(a) = s,
sendo portanto legitimado. 

Proposição 6.3 Seja r uma relação. As seguintes propriedades são demons-


tráveis em S:
(a) asim(r) → irr(r).
(b) asim(r) → anti(r).
(c) (sim(r) ∧ tran(r)) → ref (r).

Demonstração: (a) Seja x ∈ F (r); como r é asimétrica, então (x r x) implica


¬(x r x), donde obtemos ¬(x r x).
(b) Sejam x, y ∈ F (r) tais que (x r y)∧(y r x). Logo, obtemos ¬(y r x), pois r é
asimétrica, donde deduzimos uma contradição. Portanto (x, y ∈ F (r))∧asim(r)
implica ¬((x r y) ∧ (y r x)), e a posteriori ¬((x r y) ∧ (y r x)) ∨ (x = y), isto
é, ((x r y) ∧ (y r x)) → (x = y).
(c) Suponha que x ∈ F (r). Se x ∈ dom(r), então x r y para algum y ∈ F (r).
Como sim(r), então y r x, donde (x r y) ∧ (y r x). Portanto x r x, pois tran(r).
Por outro lado, se x ∈ im(r), então y r x para algum y ∈ F (r), e a prova é
análoga. 

Podemos definir cinco tipos de ordens:

Definição 6.4 Sejam r uma relação e a um conjunto. Definimos o seguinte:


(a) qo(r, a) denota ref (r, a) ∧ tran(r, a) (r é uma quase ordem em a).
(b) op(r, a) denota ref (r, a) ∧ anti(r, a) ∧ tran(r, a) (r é uma ordem parcial em
a).
(c) os(r, a) denota anti(r, a) ∧ tran(r, a) ∧ f con(r, a) (r é uma ordem simples
em a).

20
(d) ope(r, a) denota asim(r, a) ∧ tran(r, a) (r é uma ordem parcial estrita em
a).
(e) ose(r, a) denota asim(r, a) ∧ tran(r, a) ∧ con(r, a) (r é uma ordem simples
estrita em a).
(f ) qo(r) denota qo(r, F (r)), etc.

Se r satisfaz alguma das definições de ordem introduzidas na Definição 6.4,


então escreveremos x ≤ y ou ainda x < y (se r é irreflexiva) no lugar de x r y,
quando não existir risco de confusão.

Exemplos 6.5 (1) Dado um conjunto b, então a = P(b) é parcialmente orde-


nado pela relação x ≤ y sse x ⊆ y ⊆ b. Com efeito, ≤ é parcial, pois nem todo
par de subconjuntos x, y de b deve ser necessariamente comparável pela relação
de inclusão.
(2) O conjunto N dos números naturais é ordenado pela relação: n ≤ m sse n|m
(n divide a m). Com efeito, n ≤ n para todo n, pois n = 1.n, donde n|n. Por
outro lado, n|m e m|n significa: existem k, h em N tais que m = kn, n = hm,
portanto m = k(hm) = (kh)m. Se m = 0, então n = h.0 = 0 = m. Se m 6= 0,
então de m = (kh)m inferimos 1 = kh, e então k = 1 = h, donde n = m.
Finalmente, se n ≤ m e m ≤ r, então m = kn e r = hm para certos k, h ∈ N.
Portanto r = hm = h(kn) = (hk)n para hk ∈ N donde n|r, isto é, n ≤ r.
Observe que 1|n para todo n, pois n = n.1; logo 1 ≤ n para todo n, isto é, 1 é
o mı́nimo elemento de N com a ordem divide a. Por outro lado, 0 = 0.n para
todo n, e então n|0 para todo n, isto é, n ≤ 0 para todo n. Daqui 0 é o máximo
elemento de N com a ordem divide a. Observe que a ordem não é conectada:
2 6≤ 3 e 3 6≤ 2, pois 2 e 3 são co-primos. Os números primos positivos são
os elementos minimais, isto é, se n ≤ p e p é primo, então n = 1 (o mı́nimo
elemento com relação a ≤ ) ou n = p. Reciprocamente, se p é minimal, então
p deve ser necessariamente primo. 

Proposição 6.6 Em S temos o seguinte:


(a) op(r) → qo(r).
(b) os(r) → op(r).
(c) os(r) → os(r−1 ).
(d) qo(r) ∧ qo(s) → qo(r ∩ s).

Demonstração: (a) Imediato das definições.


(b) Só falta provar a reflexividade da r. Mas x ∈ F (r) implica ((x r x) ∨ (x r
x)), isto é, x r x, pois f con(r).
(c) É claro que tran(r) → tran(r−1 ). Com efeito, ((x r−1 y)∧(y r−1 z)) implica
((y r x) ∧ (z r y)) implica z r x (pois tran(r)) implica x r−1 z. Da mesma
maneira provamos que anti(r) → anti(r−1 ) e f con(r) → f con(r−1 ).
(d) Seja x ∈ F (r ∩ s), logo x ∈ F (r) ∩ F (s), donde ((x r x) ∧ (x s x)), pois
ref (r) ∧ ref (s). Portanto x (r ∩ s) x, isto é, ref (r ∩ s). Suponha agora que ((x
(r ∩ s) y) ∧ (y (r ∩ s) z)). Daqui obtemos ((x r y) ∧ (y r z)), donde x r z, pois
tran(r). Analogamente x s z, e então x (r ∩ s) z; isto é, tran(r ∩ s). 

21
Observe que a reunião de duas quase-ordens não resulta necessariamente numa
quase-ordem. Por exemplo

r = {h1, 1i, h2, 2i, h1, 2i}, s = {h2, 2i, h3, 3i, h2, 3i}

são duas quase-ordens, mas a união, embora reflexiva, não é transitiva. A


situação muda se F (r) ∩ F (s) = ∅.
Proposição 6.7 S ` (qo(r) ∧ qo(s) ∧ (F (r) ∩ F (s) = ∅)) → qo(r ∪ s).
Demonstração: É claro que r ∪ s é reflexiva. Suponha que ((x (r ∪ s) y) ∧ (y
(r ∪ s) z)). Como F (r) ∩ F (s) = ∅, então só vale uma das seguintes afirmações:

((x r y) ∧ (y r z)), ((x s y) ∧ (y s z)).

Nos dois casos, obtemos x (r ∪ s) z, pois tran(r) ∧ tran(s). 

Proposição 6.8 S ` ((r ⊆ s) ∧ (s ⊆ (a × a)) ∧ ose(r, a) ∧ ose(s, a)) → (r = s).

Demonstração: Suponha que x s y mas ¬(x r y). Como asim(s), então


x 6= y, donde y r x, pois con(r, a). Portanto y s x, pois r ⊆ s, o que contradiz
asim(s). 

O significado da proposição precedente é o seguinte: uma ordem simples estrita


em a ordena todos os elementos de a numa ordem estrita, isto é: x 6< x para
todo x ∈ a. Portanto, se r, s são duas ordens estritas simples em a tal que s
estende r, então elas devem necessariamente coincidir, pois r já ordenou todos
os elementos de a.
Introduziremos agora a importante noção de boa ordem. Uma boa ordem
em a é uma ordem simples estrita r tal que todo subconjunto não vazio de a
tem um elemento mı́nimo segundo r. De fato, a conectividade de r implicará a
transitividade e asimetria de r. Antes da definição, analizaremos alguns exem-
plos.
Exemplos 6.9 (a) O conjunto N dos números naturais é bem ordenado pela
relação < usual (menor que). De fato, ∅ =
6 A ⊆ N possui um elemento mı́nimo.
(b) N não é bem ordenado pela ordem simples estrita > (maior que). Com
efeito, ∅ =6 A ⊆ N tem elemento mı́nimo com relação a > significa que existe
n ∈ A tal que n > m para todo m ∈ A. Em particular, o próprio N deveria ter
um primeiro elemento relativo a >, isto é, deveria existir n ∈ N tal que n > m
para todo m ∈ N; mas isto não é verdade (n 6> n + 1).
(c) Considere A = {(n − 1)/n : n ∈ N ∧ n 6= 0} ∪ {1} ordenado pela relação
< usual (em Q, o conjunto dos números racionais). Logo, A é bem ordenado.
Com efeito,

(n − 1)/n < (m − 1)/m sse m(n − 1) < n(m − 1) sse

mn − m < nm − n sse − m < −n sse n < m.

22
Portanto, ∅ 6= B ⊆ A tem primeiro elemento (n − 1)/n, onde n é o mı́nimo m
tal que (m − 1)/m ∈ B. Se B = {1}, então claramente 1 é o primeiro elemento
de B.
(d) Seja A como no item (c). Logo, > (a ordem maior que de Q) não é uma
boa ordem em A, pois B = A − {1} não tem primeiro elemento. Com efeito,
se x = (n − 1)/n fosse mı́nimo, então (n − 1)/n > n/(n + 1) donde n > n + 1,
uma contradição. 

Definição 6.10 Definimos o seguinte:


(a) min(x, r, a) denota x ∈ a ∧ (∀y)(y ∈ a → ¬(y r x)) (x é um elemento
r-minimal de a).
(b) pe(x, r, a) denota x ∈ a ∧ (∀y)((y ∈ a ∧ x 6= y) → x r y) (x é um r-primeiro
elemento de a).
(c) bo(r, a) denota con(r, a) ∧ (∀b)((b ⊆ a ∧ b 6= ∅) → (∃x)min(x, r, b)) (r é uma
boa ordem em a).

Observação 6.11 Um elemento minimal não tem antecessores, enquanto que


um primeiro elemento precede todo outro elemento diferente dele mesmo. Se r
é asimétrica, então todo primeiro elemento é minimal. Com efeito, seja x ∈ a
primeiro elemento de r. Se y ∈ a, então ¬(y r x) se y = x, pois r é irreflexiva.
Se y 6= x, então x r y, pois x é primeiro elemento. Logo ¬(y r x), pois r é
asimétrica, e então x é minimal. Observe que r = {h1, 1i} em a = {1} tem
trivialmente 1 como primeiro elemento, mas 1 não é minimal, pois 1 r 1; vemos
que a hipótese de asimetria é fundamental. A recı́proca não vale em geral: 1
é minimal em r = {h1, 2i} sobre a = {1, 2, 3}, mas 1 não é primeiro elemento,
pois ¬(1 r 3). Se r é conectada e asimétrica, as duas noções coincidem. Com
efeito, se x é minimal e y 6= x, então ¬(y r x), pois x é minimal. Mas r é
conectada, portanto x r y. Daqui x é primeiro elemento. 

Proposição 6.12 S ` bo(r, a) → (asim(r, a) ∧ tran(r, a)).

Demonstração: Sejam x, y ∈ a tais que x r y, y r x. Logo, {x, y} não tem


elemento minimal. Com efeito, y não é minimal, pois x r y. Analogamente,
y r x implica que x não é minimal; isto contraria o fato de r ser uma boa
ordem. Portanto, r deve ser asimétrica. Sejam agora x, y, z ∈ a tais que x r
y, y r z, ¬(x r z). Como r é asimétrica, então x 6= z. Logo, z r x, pois r é
conectada. Mas então {x, y, z} não tem elemento minimal: x r y implica que y
não é minimal; y r z implica que z não é minimal. Finalmente, z r x implica
que x não pode ser minimal. Daqui, inferimos que r é transitiva. 

Proposição 6.13
(a) ` bo(r, a) ↔ (asim(r, a) ∧ con(r, a) ∧ (∀b)(b 6= ∅ ∧ b ⊆ a → (∃x)pe(x, r, b))).
(b) ` bo(r, a) ∧ a 6= ∅ → (∃!x)pe(x, r, a). Aqui, a notação (∃!x)ϕ(x) indica:
(∃x)(ϕ(x) ∧ (∀y)(ϕ(y) → (y = x))) (“existe um único x tal que ϕ(x)”).
(c) ` bo(r, a) ∧ b ⊆ a → bo(r, b).

23
Demonstração: (a) Assuma bo(r, a); pela Proposição 6.12, obtemos asim(r, a).
Claro que con(r, a), pela definição de boa ordem. Se ∅ = 6 b ⊆ a, então existe
x ∈ b tal que min(x, r, b). Pela Observação 6.11, pe(x, r, b). Reciprocamente,
suponha que (∀b)(b 6= ∅ ∧ b ⊆ a → (∃x)pe(x, r, b)), asim(r, a) e con(r, a). Logo,
con(r, a). Dado ∅ =6 b ⊆ a, seja x ∈ b tal que pe(x, r, b). Pela Observação 6.11
obtemos min(x, r, b), pois asim(r, a).
(b) Se ∅ =6 a, então, de a ⊆ a, obtemos (∃x)pe(x, r, a), pelo item (a). Sejam
x, y ∈ a tais que pe(x, r, a), pe(y, r, a). Se x 6= y, então x r y, y r x. Mas
asim(r, a), pela Proposição 6.12. Logo x = y.
(c) Suponha que bo(r, a) e b ⊆ a. É claro que con(r, b). Se ∅ 6= c ⊆ b, então
∅=6 c ⊆ a, donde min(x, r, c) para algum x ∈ c. Portanto bo(r, b). 

Definição 6.14 si(y, x, r) denota (x r y) ∧ (∀z)((x r z) → (z = y ∨ (y r z)))


(“y é um r-sucessor imediato de x”).
ue(x, r, a) denota (x ∈ a) ∧ (∀y)(((y ∈ a) ∧ y 6= x) → y r x) (“x é um r-último
elemento de a”).

Proposição 6.15 S ` pe(x, r, a) ↔ ue(x, r−1 , a).

Demonstração: Imediata. 

Proposição 6.16 S ` (bo(r, a) ∧ (F (r) ⊆ a) ∧ (x ∈ a) ∧ ¬ue(x, r, a))


→ (∃!y)si(y, x, r).

Demonstração: Por [A2] podemos formar b = {y : y ∈ F (r)∧(x r y)}. Dado


que F (r) ⊆ a, então obtemos que b = {y : x r y} ⊆ a. Pela Proposição 6.13(c),
temos que bo(r, b). Como x não é um último r-elemento de a, então b 6= ∅.
Portanto, existe um único r-primeiro elemento y de b, pela Proposição 6.13(b).
Temos que x r y, pois y ∈ b. Por outro lado, se (x r z) e z 6= y, então y r z, pela
definição de b e a definição de primeiro elemento. Portanto, y é um r-sucessor
imediato de x. Por outro lado, z é um r-sucessor imediato de x sse z é um
primeiro elemento de b. Portanto, y é único. 

7 Relações de Equivalência
As relações de equivalência são utilizadas com frequência na Matemática. São
relações reflexivas, simétricas e transitivas. Dois exemplos básicos são a relação
de identidade e a relação de paralelismo entre retas. Como veremos depois,
uma relação de equivalência num conjunto a classifica os seus elementos de
acordo com algum critério. Esta é uma ferramenta muito útil nas construções
matemáticas, pois permite simplificar os domı́nios, analizando as classes dos
objetos no lugar dos próprios objetos. Os objetos pertencentes a uma mesma
classe são considerados idênticos.
Definição 7.1 equiv(r) denota rel(r) ∧ ref (r) ∧ sim(r) ∧ tran(r) (“r é uma
relação de equivalência”).
equiv(r, a) denota a = F (r) ∧ equiv(r) (“r é uma relação de equivalência em
a”).

24
Proposição 7.2 (a) S ` equiv(r) → (r ◦ r−1 = r).
(b) S ` qo(r) → equiv(r−1 ∩ r).

Demonstração: (a) Se x (r ◦ r−1 ) y então existe z tal que x r z, z r−1 y.


Daqui obtemos y r z e então z r y, pois sim(r), donde x r y, pois tran(r). Isto
é, r ◦ r−1 ⊆ r. Por outro lado, x r y implica (x r y) ∧ (y r−1 y), donde x (r ◦ r−1 )
y. Portanto r = r ◦ r−1 .
(b) É imediato que r−1 ∩ r = {hx, yi : (x r y) ∧ (y r x)}. Daqui o resultado é
trivial. 

Definição 7.3 r[x] = {y : x r y}.

Dado que r[x] = {y : y ∈ F (r) ∧ (x r y)}, então r[x] é legitimado. É imediato


que r[x] = r“{x}. A notação usual em Matemáticas para r[x] é simplesmente
[x], isto é, r é subentendida.

Proposição 7.4 S ` (x, y ∈ F (r) ∧ equiv(r)) → (r[x] = r[y] ↔ (x r y)).

Demonstração: Assuma r[x] = r[y], isto é, (x r z) ↔ (y r z). Como y r y,


então x r y. Suponha agora x r y, e seja z tal que x r z. De sim(r) obtemos
y r x, e então inferimos: (y r x), (x r z) implica y r z, pois tran(r). De x r y
provamos analogamente (y r z) → (x r z). Isto é, r[x] = r[y]. 

Proposição 7.5 S ` equiv(r) → (r[x] = r[y] ∨ (r[x] ∩ r[y] = ∅)).

Demonstração: Suponha que r[x] 6= r[y]; se x 6∈ F (r) ou y 6∈ F (r) então


claramente r[x] ∩ r[y] = ∅. Se x, y ∈ F (r), então seja z ∈ r[x] ∩ r[y]. Logo
(x r z) e (y r z), donde obtemos x r y e posteriormente, pela Proposição 7.4,
r[x] = r[y], uma contradição . Portanto, r[x] ∩ r[y] = ∅. 

Veremos a continuação a estreita relação entre partições e relações de equiva-


lência.

Definição 7.6 par(Π, a) denota


S
( Π = a) ∧ (∀b)(∀c)(((b ∈ Π) ∧ (c ∈ Π) ∧ b 6= c) → b ∩ c = ∅)∧
∧(∀x)(x ∈ Π → (∃y)(y ∈ x))
(“Π é uma partição de a”).

Por exemplo, se a = {1, 2, 3, 4, 5}, então Π = {{1, 4}, {2}, {3, 5}} é uma partição
de a, enquanto que

Π1 = {{1}, {2, 3, 4}}, Π2 = {{1, 2}, {2, 3}, {4}, {5}}

não são partições de a (porqué?). Observe que ∅ é a única partição possı́vel do


conjunto ∅.

Proposição 7.7 S ` a 6= ∅ → par({a}, a).

25
S
Demonstração: Temos que {a} = a. Dado que não existem b, c ∈ {a}
com b 6= c, então a segunda condição de par(Π, a) é trivialmente satisfeita.
Finalmente, seja x ∈ {a}; é claro que x = a. Dado que a 6= ∅, então existe
y ∈ a, e a terceira condição de par(Π, a) é satisfeita por Π = {a}. 

Um conceito importante entre partições é a relação mais fina que. Intuitiva-


mente, uma partição Π1 é mais fina que Π2 se todo elemento de Π1 está contido
em algum elemento de Π2 , e dai a denominação mais fina resulta óbvia. Por
exemplo, considere as seguintes partições de a = {1, 2, 3, 4, 5}:

Π1 = {{1}, {2, 3}, {4, 5}}, Π2 = {{1}, {2, 3}, {4}, {5}},

Π3 = {{1}, {2}, {3}, {4}, {5}}, Π4 = {{1, 2, 3}, {4}, {5}}.

É imediato que Π2 é mais fina que Π1 e Π4 , enquanto que Π3 é mais fina do que
as outras partições. Por outro lado, Π1 e Π4 não são comparáveis pela relação
“mais fina que”.

Definição 7.8 mf (Π1 , Π2 ) denota Π1 6= Π2 ∧ (∀x)(x ∈ Π1 → (∃y)((y ∈ Π2 ) ∧


(x ⊆ y))) (“a partição Π1 é mais fina do que a partição Π2 ”).

Proposição 7.9 Todo conjunto tem uma partição mais fina do que todas as
outras partições do conjunto.

Demonstração: Seja Π = {y : y ∈ P(a) ∧ (∃x)((x ∈ a) ∧ y = {x})}.


Temos que Π é legitimado por [A2], e podemos escrever
S Π = {{x} : x ∈ a}.
Provaremos
S par(Π, a). Primeiro de tudo, temos Π = a. Com efeito, seja
x ∈ Π; logo, existe y ∈ Π tal que x ∈ y. Mas y = {z} com z ∈ a, pela
definição
S de Π. Daqui, x ∈ y, y = {z} implica x = z e logo x ∈ a. Isto é,
ΠS⊆ a. Por outro lado,
S seja x ∈ a; logo y = {x} ∈ Π tal que x ∈ y, donde
x ∈ Π, isto é, a = Π. Sejam b, c ∈ Π com b 6= c. Logo b = {x}, c = {y}
tal que x, y ∈ a. Portanto, b 6= c implica x 6= y, e então b ∩ c = ∅. Finalmente,
b ∈ Π implica que b = {x} para algum x ∈ a; daqui x ∈ b e logo (∃z)(z ∈ b).
Isto prova que par(Π, a). Suponha S agora que par(Π1 , a) e Π1 6= Π. Seja y ∈ Π;
logo y = {x} com x ∈ a. Como Π1 = a, então existe z ∈ Π1 tal que x ∈ z,
donde y = {x} ⊆ z, isto é, mf (Π, Π1 ). 

Vemos então que Π3 no exemplo acima é de fato a partição mais fina sobre a.
Provaremos a continuação que toda relação de equivalência sobre um con-
junto a origina uma partição sobre a.

Definição 7.10 Π(r) = {b : (∃x)(x ∈ F (r) ∧ b = r[x])}.

É imediato que Π(r) = {b : (b ∈ P(F (r))) ∧ (∃x)(x ∈ F (r) ∧ b = r[x])},


portanto Π(r) é legitimado por [A2]. O resultado procurado é o seguinte:

Proposição 7.11 S ` equiv(r, a) → par(Π(r), a).

26
Demonstração: Temos que equiv(r, a) implica S equiv(r)∧(a = F (r)). Podemos
escrever Π(r) = {r[x] : x ∈ a}. Seja y ∈ SΠ(r); logo existe x ∈ a tal que
y ∈ r[x], donde x r y, isto é, y ∈ a. Daqui Π(r) S⊆ a. Por outro S lado, seja
x ∈ a. Logo (x ∈ r[x]) ∧ (r[x] ∈ Π(r)), donde x ∈ Π(r). Isto é, Π(r) = a.
Sejam r[x], r[y] ∈ Π(r). Se r[x] 6= r[y] então r[x] ∩ r[y] = ∅, pela Proposição 7.5.
Finalmente, dado r[x] ∈ Π(r), temos que x ∈ r[x], isto é, (∃y)(y ∈ r[x]),
provando assim que par(Π(r), a). 

Podemos relacionar a inclusão de relações de equivalência com a relação “mais


fina que” das partições associadas.

Proposição 7.12 S ` (equiv(r, a) ∧ equiv(s, a)) → (r ⊂ s ↔ mf (Π(r), Π(s)).

Demonstração: Assuma equiv(r, a)∧equiv(s, a). Suponha r ⊂ s; como r 6= s,


existem x, y ∈ a tais que x s y mas ¬(x r y). Desta maneira, y ∈ s[x] − r[x]
e então r[x] 6= s[x]. Seja z ∈ r[x]; portanto x r z, donde x s z, pois r ⊂ s.
Daqui z ∈ s[x], e então r[x] ⊂ s[x]. Assim r[x] 6= s[w] para todo w ∈ a, pois
par(Π(s), a). Daqui r[x] ∈ Π(r) − Π(s) e então Π(r) 6= Π(s). Seja y ∈ Π(r);
logo y = r[x] para algum x ∈ a, e então r[x] ⊆ s[x], com s[x] ∈ Π(s), pois
r ⊂ s. Isto é, mf (Π(r), Π(s)). Reciprocamente, suponha mf (Π(r), Π(s)). Logo
Π(r) 6= Π(s). Se x r y então y ∈ r[x]; mas r[x] ⊆ s[z] para algum z, donde
y ∈ s[z], isto é, y s z. Mas x ∈ r[x] ⊆ s[z], portanto x ∈ s[z], donde x s z. De
y s z obtemos z s y e então x s y; logo r ⊆ s. Finalmente, suponha que r = s.
Logo, r[x] = s[x] para todo x ∈ a, donde Π(r) = Π(s), contradição. Portanto
r ⊂ s. 

Provaremos agora que uma partição origina uma relação de equivalência.

Definição 7.13 r(Π) = {hx, yi : (∃b)((b ∈ Π) ∧ x, y ∈ b)}.

É imediato que r(Π) é legitimado, pois


[ [
r(Π) = {z : z ∈ ( Π)×( Π)∧(∃x)(∃y)(z = hx, yi∧(∃b)((b ∈ Π)∧x, y ∈ b))}.

Proposição 7.14 S ` par(Π, a) → equiv(r(Π), a).

Demonstração: É imediato que par(Π, a) implica F (r(Π)) = a. Se x ∈ a,


então existe b ∈ Π tal que x ∈ b; daqui x r(Π) x, isto é, ref (r(Π), a) . A prova
da simetria de r(Π) é imediata. Sejam x, y ∈ a tais que x r(Π) y, y r(Π) z; então
x, y ∈ b e y, z ∈ c para b, c ∈ Π. Logo y ∈ b ∩ c, donde b = c. Daqui x, z ∈ c,
c ∈ Π, e então x r(Π) z. Isto é, tran(r(Π), a), portanto equiv(r(Π), a). 

Vamos agora relacionar partições com relações de equivalência. Provaremos


que, partindo de uma relação de equivalência r, então a partição Π(r) é tal que
a relação de equivalência gerada, r(Π(r)), coincide com r. Analogamente, a
relação r(Π) gerada por uma partição Π é tal que Π(r(Π)) = Π.

Proposição 7.15 S ` (par(Π, a) ∧ equiv(r, a)) → (Π = Π(r) ↔ r(Π) = r).

27
Demonstração: Assuma par(Π, a) ∧ equiv(r, a). Suponha Π = Π(r). De
equiv(r, a) obtemos x r y sse (∃z)(x, y ∈ r[z]). Mas b ∈ Π sse (∃z)(b = r[z]),
por hipótese. Logo

x r y sse (∃b)(x, y ∈ b ∧ b ∈ Π) sse x r(Π) y,

isto é, r = r(Π). Reciprocamente, suponha r = r(Π). Se b ∈ Π, então existe


x ∈ a tal que x ∈ b. Portanto y ∈ b sse x r(Π) y sse x r y sse y ∈ r[x].
Daqui b = r[x] ∈ Π(r). Por outro lado, seja r[x] ∈ Π(r). Como x ∈ a, então
existe b ∈ Π tal que x ∈ b. Portanto b = r[x], como acabamos de provar. Logo
r[x] ∈ Π. Isto é, Π = Π(r). 

Finalmente provaremos que a relação “mais fina que” é de fato uma ordem
parcial estrita. Considere P AR(a) = {Π : par(Π, a)}. Temos que P AR(a) é
legitimado, pois

P AR(a) = {Π : Π ∈ PP(a) ∧ par(Π, a)}

Considere agora

<a = {u : u ∈ P AR(a) × P AR(a) ∧ (∃Π1 )(∃Π2 )(u = hΠ1 , Π2 i ∧ mf (Π1 , Π2 )}

Temos que <a é legitimado por [A2], e Π1 <a Π2 sse mf (Π1 , Π2 ) para toda
Π1 , Π2 ∈ P AR(a).

Proposição 7.16 (a) S ` (Π1 <a Π2 ) ↔ (r(Π1 ) ⊂ r(Π2 )).


(b) S ` ope(<a , P AR(a)).

Demonstração: (a) Sejam Π1 , Π2 ∈ P AR(a). Logo,

Π1 <a Π2 sse mf (Π1 , Π2 ) sse

mf (Π(r(Π1 )), Π(r(Π2 ))) ∧ equiv(r(Π1 ), a) ∧ equiv(r(Π2 ), a)


(por 7.14, 7.11, 7.15) sse

r(Π1 ) ⊂ r(Π2 ) (por 7.12).

(b) Sejam Π1 , Π2 ∈ P AR(a) tais que Π1 <a Π2 ; por (a) temos que r(Π1 ) ⊂
r(Π2 ). Se Π2 <a Π1 então r(Π2 ) ⊂ r(Π1 ), uma contradição. Logo, <a é
asimétrica. Se Π1 <a Π2 , Π2 <a Π3 , então r(Π1 ) ⊂ r(Π2 ) e r(Π2 ) ⊂ r(Π3 ),
donde r(Π1 ) ⊂ r(Π3 ). Portanto Π1 <a Π3 , por (a). Isto é, <a é uma ordem
parcial estrita em P AR(a). 

Exemplo 7.17 Fixemos k ∈ Z, onde Z denota o conjunto dos números inteiros.


Definimos em Z a relação seguinte:

n Rk m sse k|(n − m) sse existe z ∈ Z tal que n − m = z.k .

28
Observe que n Rk m sse n e m tém o mesmo resto na divisão por k. Com efeito,
assumamos que n Rk m; logo, n − m = z.k. Por outro lado, n = z1 .k + r1 ,
m = z2 .k + r2 , onde 0 ≤ r1 , r2 < k. Se r1 ≥ r2 , então
n − m = (z1 .k + r1 ) − (z2 .k + r2 ) = (z1 − z2 ).k + (r1 − r2 ) = z.k
onde 0 ≤ r1 − r2 < k. Pela unicidade do algoritmo da divisão, temos que
r1 − r2 = 0, donde r1 = r2 . Analogamente, se r1 ≤ r2 , então
m − n = (z2 .k + r2 ) − (z1 .k + r1 ) = (z2 − z1 ).k + (r2 − r1 ) = (−z).k
onde 0 ≤ r2 − r1 < k. Pela unicidade do algoritmo da divisão, temos que
r2 − r1 = 0, donde r1 = r2 . Reciprocamente, se n e m têm o mesmo resto na
divisão por k, então n = z1 .k + r1 , m = z2 .k + r1 , portanto n − m = (z1 − z2 ).k,
donde k|(n − m), isto é, n Rk m. Provaremos a seguir que Rk é uma relação de
equivalência (observe que F (Rk ) = Z).
Se n ∈ Z, então n − n = 0 = 0.k, donde n Rk n, isto é, Rk é reflexiva.
Se n Rk m, então n − m = z.k, donde m − n = (−z).k, com −z ∈ Z; isto é,
m Rk n. Finalmente, assumamos que n Rk m, m Rk w. Logo, n − m = z1 .k,
m − w = z2 .k, donde n − w = (n − m) + (m − w) = z1 .k + z2 .k = (z1 + z2 ).k, com
z1 + z2 ∈ Z. Daqui n Rk w, e Rk é uma relação de equivalência. O conjunto
Π(Rk ) é usualmente denotado por Zk . Observe que Rk = R−k para todo k ∈ Z.
Para ilustrar estas definições, considere k = 6; logo, os únicos restos possı́veis
da divisão de n por 6 são: 0, 1,. . . , 5. Daqui inferimos que as únicas classes
de equivalência possı́veis para R6 são n ≡def R6 [n], com 0 ≤ n ≤ 5, portanto
Z6 = {0, . . . , 5}, sendo que, para 0 ≤ n ≤ 5, n é o conjunto dos números inteiros
m tais que o resto da divisão de m por 6 é n. Analogamente, Z3 = {0, 1, 2},
onde agora n = {m : o resto da divisão de m por 3 é n} (n = 0, 1, 2). Observe
que, se 6|(n − m), então 3|(n − m), pois 3|6; daqui, R6 é mais fina do que R3 .
Dado que 3 = 1.3+0, 4 = 1.3+1, 5 = 1.3+2, então R6 [3] ⊆ R3 [0], R6 [4] ⊆ R3 [1]
e R6 [5] ⊆ R3 [2], donde
R3 [0] = R6 [0] ∪ R6 [3], R3 [1] = R6 [1] ∪ R6 [4], R3 [2] = R6 [2] ∪ R6 [5].
Em geral, Rm é mais fina do que Rn sse n|m. Temos portanto que R0 produz a
partição mais fina de Z, pois m|0 para todo m. Para verificar isto diretamente,
observe que n R0 m sse n − m = z.0 = 0 sse n = m, donde R0 [n] = {n}
para todo n ∈ Z. Por outro lado, R1 produz a partição menos fina {Z}. Com
efeito, 1|n para todo n, donde Rn é mais fina do que R1 . É claro que n R1
m sse 1|(n − m), condição que resulta verdadeira para todo n, m ∈ Z, e então
R1 [0] = Z. 

8 Funções
O importante conceito de função, cuja definição foi discutida até finais do século
19, pode ser introduzido elegantemente na linguagem da TC. Informalmente,
uma função é uma relação em que cada elemento do domı́nio tem associado
um único elemento na imagem; isto não proibe, é claro, que dois elementos
diferentes do domı́nio possam ter associados o mesmo elemento na imagem.

29
Definição 8.1 f un(f ) denota rel(f ) ∧ (∀x)(∀y)(∀z)(((x f y) ∧ (x f z)) → y =
z) (“f é uma função”).
É claro que f un(f ) equivale a: rel(f ) ∧ (∀x)(x ∈ dom(f ) → (∃!y)(x f y)).
Usaremos a notação f (x) para indicar o único y tal que x f y. Por exemplo, se
f = {h1, 2i, h2, 2i, h3, 5i}, então f (1) = 2, f (2) = 2, f (3) = 5. A notação f (x)
(introduzida na Definição 5.1) é legitimada pela Proposição 5.3. A composição
f • g de duas funções f , g é definida de maneira que (f • g)(x) = f (g(x)).
Isto significa que f • g é a composição (como relações) g ◦ f introduzida na
Definição 5.6.
Lema 8.2 (a) S ` f un(f ) → (∀x)(∀y)((x f y) → y = f (x)).
(b) S ` (f un(f ) ∧ x ∈ dom(f )) → (x f f (x)).
Demonstração: (a) Assuma f un(f ). Se x f y, provaremos:

z ∈ y ↔ (∃u)((∀w)((x f w) ↔ w = u) ∧ z ∈ u)

(lembrando que a formula à direita do primeiro “ ↔ ” significa “z ∈ f (x)”).


Daqui, teremos, por [A1], que y = f (x). Com efeito, temos o seguinte:
f un(f ), x f y, x f w implica w = y; x f y, w = y implica x f w, portanto
f un(f ), x f y implica (∀w)(x f w ↔ w = y), donde f un(f ), x f y, z ∈ y implica
(∀w)(x f w ↔ w = y)∧z ∈ y. Daqui obtemos (∃u)((∀w)((x f w) ↔ w = u)∧z ∈
u), isto é: f un(f ), x f y implica z ∈ y → z ∈ f (x).
Por outro lado, x f y, (∀w)((x f w) ↔ w = u) implica (x f y) ∧ (x f u), donde,
usando f un(f ), obtemos y = u. Daqui, provamos: f un(f ), x f y, z ∈ f (x)
implica z ∈ y, isto é: f un(f ), x f y implica z ∈ f (x) → z ∈ y, portanto f un(f ),
x f y implica y = f (x).
(b) Assuma f un(f ) ∧ x ∈ dom(f ). Provaremos que x f f (x). Com efeito,
f un(f ), x f u implica u = f (x), por (a). Logo, f un(f ), x f u implica x f
f (x). Portanto f un(f ), (∃u)(x f u) implica x f f (x). Mas x ∈ dom(f ) implica
(∃u)(x f u), portanto: f un(f ), x ∈ dom(f ) implica x f f (x). 

Proposição 8.3 (a) S ` (f un(f ) ∧ f un(g)) → ((x (g ◦ f ) y) → y = f (g(x))).


(b) S ` (f un(f ) ∧ f un(g) ∧ x ∈ dom(g) ∧ g(x) ∈ dom(f )) → (x (g ◦ f ) f (g(x))).

Demonstração: (a) Se x (g ◦ f ) y, então x g z, z f y para algum z. Pelo


Lema 8.2(a) obtemos z = g(x) e y = f (z), donde y = f (g(x)), pelas regras da
igualdade.
(b) Pelo Lema 8.2(b), temos que g(x) f f (g(x)), pois g(x) ∈ dom(f ). Como
x ∈ dom(g), então x g g(x), novamente por 8.2(b). Daqui obtemos: x g g(x),
g(x) f f (g(x)), e então x (g ◦ f ) f (g(x)), pela Definição 5.6. 

Vemos assim que f • g ≡def g ◦ f satisfaz a propriedade desejada x (f • g) y sse


y = f (g(x)) (sob certas condições razoáveis estabelecidas na Proposição 8.3(b)).
Uma propriedade fundamental é que a composição de funções é uma função.
Proposição 8.4 (a) S ` (f un(f ) ∧ f un(g)) → (f un(f ∩ g) ∧ f un(f • g)).
(b) S ` (f un(f ) ∧ f un(g) ∧ x ∈ dom(f • g)) → (f • g)(x) = f (g(x)).

30
Demonstração: (a) Sejam x, y, z tais que , x (f ∩ g) y, x (f ∩ g) z. Daqui
obtemos x f y, x g y, x f z, x g z. Como f un(f ), f un(g), então y = z,
donde f un(f ∩ g). Por outro lado, suponha que x (f • g) y, x (f • g) z. Pela
Proposição 8.3(a) obtemos y = f (g(x)), z = f (g(x)), donde y = z e então
f un(f • g).
(b) Assuma f un(f ), f un(g), x ∈ dom(f • g). Pelo item (a) obtemos f un(f •
g), x ∈ dom(f • g), donde x (f • g) ((f • g)(x)), pelo Lema 8.2(b). Pela
Proposição 8.3(a) obtemos (f • g)(x) = f (g(x)). 

Daqui em diante, quando não houver risco de confusão, escreveremos f ◦ g no


lugar de f • g, se f e g são funções. Algumas das propriedades provadas na
Proposição 5.10 podem ser fortalecidas, no caso em que f é função.

Proposição 8.5 (a) S ` (f • g)|z = f • (g|z).


(b) S ` f un(f ) → (f −1 “(a∩b) = f −1 “(a)∩f −1 “(b))∧(f −1 “(a−b) = f −1 “(a)−
f −1 “(b)).

Demonstração: (a) É uma reformulação da Proposição 5.9(e).


(b) Assuma f un(f ). Pela Proposição 5.10(b),(c), basta provar

f −1 “(a) ∩ f −1 “(b) ⊆ f −1 “(a ∩ b),

e f −1 “(a − b) ⊆ f −1 “(a) − f −1 “(b).


Se x ∈ f −1 “(a) ∩ f −1 “(b), então existem y ∈ a, w ∈ b tais que x f y, x f
w. Como f un(a), então y = w, portanto y ∈ a ∩ b tal que x f y, donde
x ∈ f −1 “(a ∩ b).
Seja agora x ∈ f −1 “(a − b). Logo, existe y ∈ a − b tal que x f y, e então
x ∈ f −1 “(a). Se x ∈ f −1 “(b), então existe z ∈ b tal que x f z. Como f un(f ),
obtemos y = z donde y ∈ b, uma contradição. Portanto x ∈ f −1 “(a) − f −1 “(b).


Definição 8.6 inj(f ) denota f un(f ) ∧ f un(f −1 ) (“f é injetora”).

Proposição 8.7 (a) S ` (inj(f ) ∧ x, y ∈ dom(f )) → (f (x) = f (y) ↔ x = y).


(b) S ` (inj(f ) ∧ x ∈ dom(f ) ∧ y ∈ im(f )) → (f −1 (y) = x ↔ y = f (x)).
(c) S ` (inj(f ) ∧ x ∈ dom(f )) → f −1 (f (x)) = x.
(d) S ` (inj(f ) ∧ y ∈ im(f )) → f (f −1 (y)) = y.
(e) S ` (inj(f ) ∧ inj(g)) → inj(f ∩ g).
(f ) S ` (inj(f ) ∧ inj(g) ∧ dom(f ) ∩ dom(g) = ∅ ∧ im(f ) ∩ im(g) = ∅)
→ inj(f ∪ g).

Demonstração: (a) Assuma inj(f ) ∧ x ∈ dom(f ) ∧ y ∈ dom(f ). Se f (x) =


f (y), então obtemos que f (x) f −1 x, f (x) f −1 y. Mas f un(f −1 ), portanto
x = y. Reciprocamente, x = y implica f (x) = f (y), pelas regras da igualdade.
(b) Assuma inj(f ) ∧ x ∈ dom(f ) ∧ y ∈ im(f ). Como f un(f −1 ) ∧ y ∈ dom(f −1 ),
então x = f −1 (y) implica y f −1 x, pelo Lema 8.2(b). Daqui, x f y e então, pelo
Lema 8.2(a), obtemos y = f (x); isto é, x = f −1 (y) → y = f (x). Simetricamente
provamos y = f (x) → x = f −1 (y).

31
(c) Assuma inj(f ) ∧ x ∈ dom(f ). Logo f (x) ∈ im(f ) e f (x) = f (x). Pelo item
(b) obtemos x = f −1 (f (x)).
(d) Análogo ao item (c).
(e) Imediato a partir da Proposição 8.4 (a).
(f) x (f ∪ g) y, x (f ∪ g) z implica que (x f y) ∧ (x f z) ou (x g y) ∧ (x g z), mas
não ambas simultaneamente. Daqui y = z, e f un(f ∪ g). Da mesma maneira
(lembrando que (f ∪ g)−1 = f −1 ∪ g −1 ), x (f ∪ g)−1 y, x (f ∪ g)−1 z implica (x
f −1 y) ∧ (x f −1 z) ou (x g −1 y) ∧ (x g −1 z), mas não ambas simultaneamente.
Daqui y = z, e f un((f ∪ g)−1 ). Portanto inj(f ∪ g). 

Definição 8.8 (a) f un(f, a, b) denota f un(f ) ∧ (dom(f ) = a) ∧ (im(f ) ⊆ b)


(“f é uma função de a em b”).
(b) sobre(f, a, b) denota f un(f )∧(dom(f ) = a)∧(im(f ) = b) (“f é uma função
sobrejetora de a em b”).
(c) inj(f, a, b) denota inj(f ) ∧ (dom(f ) = a) ∧ (im(f ) ⊆ b) (“f é uma função
injetora de a em b”).
(d) bij(f, a, b) denota inj(f, a, b) ∧ sobre(f, a, b) (“f é uma função bijetora de
a em b”).
(e) ab = {f : f un(f, b, a)} (“ab é o conjunto de todas as funções de b em a”).

Observação 8.9 Podemos a partir de agora utilizar a notação usual f : a−→b


para denotar f un(f, a, b). De fato, utilizaremos as duas notações indistinta-
mente. 

Proposição 8.10 (a) S ` (f un(f, a, b) ∧ f un(g, b, c)) → f un(g ◦ f, a, c).


(b) S ` inj(f, a, b) → (bij(f, a, im(f )) ∧ bij(f −1 , im(f ), a)).
(c) S ` bij(f, a, b) → bij(f −1 , b, a).
(d) S ` (bij(f, a, b) ∧ bij(g, b, c)) → bij(g ◦ f, a, c).
(e) S ` bij(f, a, b) → ((f ◦ f −1 = I(b)) ∧ (f −1 ◦ f = I(a))).
(f ) S ` f un(f, a, b) → ((I(b) ◦ f = f ) ∧ (f ◦ I(a) = f )).

Demonstração: (a) Notar que g ◦ f é utilizado para denotar g • f , isto é, f ◦ g


(como relações). Assuma então f : a−→b, g : b−→c. Daqui obtemos:

f un(f ), dom(f ) = a, im(f ) ⊆ b, f un(g), dom(g) = b, im(g) ⊆ c.

Pela Proposição 8.4(a) obtemos f un(g ◦ f ). Por definição de composição,


dom(g ◦ f ) ⊆ dom(f ), im(g ◦ f ) ⊆ im(g); isto é, dom(g ◦ f ) ⊆ a, im(g ◦ f ) ⊆ c.
Seja x ∈ a; pela Proposição 8.3(b) temos que x (g◦f ) (g(f (x)), pois a = dom(f )
e b = dom(g), donde x ∈ dom(f ) ∧ f (x) ∈ dom(g). Daqui x ∈ dom(g ◦ f ), isto
é, dom(g ◦ f ) = a. Portanto f un(g ◦ f, a, c).
(b) Observe que dom(f −1 ) = im(f ), im(f −1 ) = dom(f ). Assuma inj(f, a, b).
Logo, temos o seguinte:

f un(f ), f un(f −1 ), dom(f −1 ) = im(f ), im(f −1 ) = a.

Daqui obtemos imediatamente inj(f −1 , im(f ), a), sobre(f −1 , im(f ), a), isto é,
bij(f −1 , im(f ), a). A fórmula bij(f, a, im(f )) é obtida trivialmente.

32
(c) Por (b) inferimos bij(f, a, b) → bij(f −1 , b, a), pois im(f ) = b.
(d) Assuma bij(f, a, b), bij(g, b, c). Daqui obtemos:
f un(f, a, b), f un(f −1 , b, a), f un(g, b, c), f un(g −1 , c, b).
Por (a) e pela Proposição 5.8(d) obtemos f un(g ◦ f, a, c), f un((g ◦ f )−1 , c, a).
Daqui dom(g ◦ f ) = a, im(g ◦ f ) = c, f un(g ◦ f ), f un((g ◦ f )−1 ), e então
bij(g ◦ f, a, c).
(e) Por (a) temos f un(f ◦ f −1 , b, b), f un(f −1 ◦ f, a, a). Seja x ∈ b; x f ◦ f −1 y
implica x f −1 z, z f y para algum z ∈ a. Daqui z f x, z f y e então y = x, isto
é: (f ◦ f −1 )(x) = x para todo x ∈ b, donde f ◦ f −1 = I(b). Seja agora x ∈ a;
x f −1 ◦ f y implica x f z, z f −1 y para algum z ∈ b. Daqui z f −1 x, z f −1 y,
donde x = y, isto é: (f −1 ◦ f )(x) = x para todo x ∈ a. Portanto f −1 ◦ f = I(a).
(f) Por (a), f un(I(b) ◦ f, a, b) ∧ f un(f ◦ I(a), a, b). Seja x ∈ a; logo (I(b) ◦
f )(x) = I(b)(f (x)) = f (x), donde I(b) ◦ f = f . Por outro lado, (f ◦ I(a))(x) =
f (I(a)(x)) = f (x), donde f ◦ I(a) = f . 

Proposição 8.11 (a) O termo ab é legitimado em S.


(b) a∅ = {∅}.
(c) a 6= ∅ → ∅a = ∅.
(d) ab = ∅ ↔ a = ∅ ∧ b 6= ∅.
(e) a{x} = {{hx, yi} : y ∈ a}.
(f ) a ⊆ b → ac ⊆ bc .

Demonstração: (a) Claramente ab = {f : f ∈ P(b × a) ∧ f un(f, b, a)},


legitimado portanto por [A2].
(b) a∅ ⊆ P(∅ × a) = P(∅) = {∅}. Por outro lado f un(∅, ∅, a) é satisfeita tri-
vialmente, e então a∅ = {∅}.
(c) Seja a 6= ∅, e suponha que f un(f, a, ∅). Seja x ∈ a; logo, x ∈ dom(f ),
portanto f (x) ∈ ∅, uma contradição.
(d) Assuma f ∈ ab . Se b 6= ∅, seja x ∈ b; portanto f (x) ∈ a, donde a 6= ∅,
provando assim: ab 6= ∅ → (b 6= ∅ → a 6= ∅). Mas b 6= ∅ → a 6= ∅ equivale
a ¬(a = ∅ ∧ b 6= ∅). Reciprocamente, suponha ¬(a = ∅ ∧ b 6= ∅), isto é,
a 6= ∅ ∨ b = ∅. Se a 6= ∅, seja y ∈ a. Logo, é imediato que f = {hx, yi : x ∈ b}
é legitimado, e f un(f, b, a). Daqui ab 6= ∅. Por outro lado, b = ∅ implica que
ab = {∅} =6 ∅, por (b). Portanto ¬(a = ∅ ∧ b 6= ∅) → ab 6= ∅.
(e) Seja b = {{hx, yi} : y ∈ a}; é claro que b é legitimado, e b ⊆ a{x} . Seja
f ∈ a{x} ; como dom(f ) = {x}, então f (x) ∈ a tal que f = {hx, f (x)i}; daqui
f ∈ b.
(f) Imediato das definições. 

9 Equipolência
A noção de equipolência foi apontada por Cantor como um conceito fundamen-
tal, pois permite generalizar a noção de número natural para cardinais. Essen-
cialmente, dois conjuntos são equipolentes se existe uma bijeção entre eles, o
que equivale a afirmar que possuem o mesmo cardinal.

33
Definição 9.1 a ≈ b denota (∃f )bij(f, a, b) (“a e b são equipolentes”).

Exemplo 9.2 Sejam a = {1, 2, 3}, b = {3, 4, 5}. Então

f = {h1, 3i, h2, 4i, h3, 5i}, g = {h1, 5i, h2, 4i, h3, 3i}

são duas bijeções entre a e b, cada uma delas garantindo a ≈ b. 

A intuição por trás de a ≈ b é que “a e b têm o mesmo número de elementos”,


o que pode ser percebido nos exemplos em que a e b são finitos (todas estas são
noções por enquanto intuitivas, mas serão formalizadas em ZF ). É também
claramente intuitivo que um conjunto finito não pode ser equipolente com um
subconjunto próprio. No caso de a ser infinito, esta propriedade deixa de ser
verdadeira: o conjunto P dos números naturais pares é um subconjunto próprio
do conjunto N dos números naturais, embora f (n) = 2.n seja uma bijeção entre
N e P. Vemos assim que a parte é menor do que a totalidade não tem mais
validade no caso infinito.

Proposição 9.3 (a) S ` a ≈ a.


(b) S ` (a ≈ b) → (b ≈ a).
(c) S ` ((a ≈ b) ∧ (b ≈ c)) → (a ≈ c).

Demonstração: (a) Pode ser provado facilmente que a relação I(a) intro-
duzida previamente à Proposição 6.2 é uma bijeção entre a e a.
(b), (c) São conseqüências imediatas da Proposição 8.10(c),(d), respectiva-
mente. 

Os seguintes resultados serão úteis para a definição da artimética cardinal.

Proposição 9.4 As seguintes fórmulas são teoremas de S:


(a) ((a ≈ b) ∧ (c ≈ d) ∧ (a ∩ c = ∅) ∧ (b ∩ d = ∅)) → (a ∪ c ≈ b ∪ d).
(b) ((a ≈ b) ∧ (c ≈ d)) → (a × c ≈ b × d).
(c) a × b ≈ b × a.
(d) a × (b × c) ≈ (a × b) × c.
(e) (a × {x} ≈ a) ∧ ({x} × a ≈ a).
(f ) (∃c)(∃d)((a ≈ c) ∧ (b ≈ d) ∧ (c ∩ d = ∅)).

Demonstração: (a) Sejam f , g tais que bij(f, a, b), bij(g, c, d). Por hipótese
temos que dom(f ) ∩ dom(g) = ∅, im(f ) ∩ im(g) = ∅, portanto inj(f ∪ g), pela
Proposição 8.7(f). É imediato provar bij(f ∪ g, a ∪ c, b ∪ d).
(b) Sejam f , g tais que bij(f, a, b), bij(g, c, d). É imediato que h ⊆ (a×c)×(b×d)
dado por
h = {hhx, yi, hf (x), g(y)ii : (x ∈ a) ∧ (y ∈ c)}
é legitimado, estabelecendo uma bijeção h(hx, yi) = hf (x), g(y)i entre a × c e
b × d.
(c) É imediato que f (hx, yi) = hy, xi é uma bijeção entre a × b e b × a.
(d) f (hx, hy, zii) = hhx, yi, zi é uma bijeção entre a × (b × c) e (a × b) × c.

34
(e) f1 (hy, xi) = y, f2 (hx, yi) = y são bijeções.
(f) Sejam c = a × {∅}, d = b × {{∅}}. Logo a ≈ c, b ≈ d, pelo item (e), e
c ∩ d = ∅. 

Os seguintes resultados serão utilizados para a exponenciação cardinal.


Proposição 9.5 Em S as seguintes fórmulas são teoremas:
(a) ((a ≈ b) ∧ (c ≈ d)) → (ac ≈ bd ).
(b) (b ∩ c = ∅) → (ab∪c ≈ ab × ac ).
(c) (a × b)c ≈ ac × bc .
(d) (ab )c ≈ ab×c .
Demonstração: (a) Se ac = ∅ então a = ∅ e c 6= ∅, donde b = ∅ e d 6= ∅.
Logo bd = ∅ e então ac ≈ bd . Suponha agora que ac 6= ∅. Sejam f , g tais que
bij(f, a, b), bij(g, c, d). Dada h ∈ ac , então f ◦ h ∈ bc , pela Proposição 8.10(a).
A partir dai, obtemos da mesma maneira f ◦ h ◦ g −1 ∈ bd . Definimos então
uma função f 0 (h) = f ◦ h ◦ g −1 tal que f 0 : ac −→bd . Dado h0 ∈ bd , então
h = f −1 ◦ h0 ◦ g é o único elemento de ac tal que h0 = f ◦ h ◦ g −1 = f 0 (h),
pela Proposição 8.10(e),(f). Portanto f 0 é uma bijeção com inversa f 0−1 (h0 ) =
f −1 ◦ h0 ◦ g.
(b) ab∪c = ∅ implica a = ∅, b ∪ c 6= ∅ implica a = ∅ e: b 6= ∅ ou c 6= ∅ implica
ab = ∅ ou ac = ∅ implica ab × ac = ∅. Logo ab∪c ≈ ab × ac . Suponha agora que
ab∪c 6= ∅. Dado f ∈ ab∪c , então hf |b, f |ci ∈ ab × ac . Defina
h = {hf, hf |b, f |cii : f ∈ ab∪c },
legitimado por [A2]. É claro que h : ab∪c −→ab × ac é uma função. Por outro
lado, se hf1 , f2 i ∈ ab × ac , então f1 ∪ f2 ∈ ab∪c tal que h(f1 ∪ h2 ) = hf1 , f2 i. Se
h(f ) = hf1 , f2 i, então f = f1 ∪ f2 , donde h−1 : ab × ac −→ab∪c é uma função.
Daqui infere-se que bij(h, ab∪c , ab × ac ).
(c) Se (a × b)c = ∅ então a × b = ∅ e c 6= ∅, donde a = ∅ ou b = ∅, e c 6= ∅.
Daqui ac = ∅ ou bc = ∅ donde ac × bc = ∅, e então (a × b)c ≈ ac × bc . Suponha
agora que (a × b)c 6= ∅. Dada f ∈ (a × b)c , considere
fa = {hx, yi : (∃z)(hx, hy, zii ∈ f )}, fb = {hx, zi : (∃y)(hx, hy, zii ∈ f )}.
Isto é, se π1 ∈ aa×b e π2 ∈ ba×b são dadas por π1 (hx, yi) = x e π2 (hx, yi) = y
(as projeções canônicas), então fa = π1 ◦ f e fb = π2 ◦ f . É claro que fa ∈ ac ,
fb ∈ bc , h = {hf, hfa , fb ii : f ∈ (a × b)c } é legitimado, e h : (a × b)c −→ac × bc
é uma função. Dada hf1 , f2 i ∈ ac × bc , então f = {hx, hf1 (x), f2 (x)ii : x ∈ c}
é legitimado, f ∈ (a × b)c , e h(f ) = hf1 , f2 i. E claro que h(f 0 ) = h(f ) implica
f = f 0 , portanto f un(h−1 , ac × bc , (a × b)c ) e assim bij(h, (a × b)c , ac × bc ).
(d) ab×c = ∅ implica a = ∅, b × c 6= ∅ implica a = ∅, b 6= ∅, c 6= ∅ implica ab = ∅,
c 6= ∅ implica (ab )c = ∅. Logo (ab )c ≈ ab×c . Suponha agora que ab×c 6= ∅. Seja
f ∈ ab×c . Para cada y ∈ c, seja
fy = {hx, zi : hhx, yi, zi ∈ f }.
É claro que fy é legitimado, fy ∈ ab , e fy (x) = f (hx, yi). Além disso, hf =
{hy, fy i : y ∈ c} ∈ (ab )c , onde hf (y) = fy . Portanto h = {hf, hf i : f ∈ ab×c }

35
é legitimado, e h : ab×c −→(ab )c é uma função, onde h(f ) = hf . Dada f 0 ∈
(ab )c , então f (hx, yi) = f 0 (y)(x) é uma função, f ∈ ab×c , e h(f ) = f 0 . Além
disso, h(f1 ) = h(f2 ) implica f1 = f2 , portanto f un(h−1 , (ab )c , ab×c ) e assim
bij(h, ab×c , (ab )c ). 

Observação 9.6 Neste ponto da nossa exposição sobre a Teoria Axiomática


de Conjuntos assumiremos que o leitor já assimilou o fato de que os enuncia-
dos dos teoremas, assim como as respectivas demonstrações, são realizados no
marco formal de ZF (ou de certos fragmentos, tais como S). Para simplificar
a exposição, a partir daqui os enunciados e demonstrações dos teoremas de ZF
serão feitos numa linguagem coloquial, omitindo os detalhes mais formais. 

Antecipando a definição de 2 = {∅, {∅}}, provamos o seguinte resultado útil,


introduzindo a idéia que os subconjuntos de um conjunto a são as funções
caracterı́sticas sobre a.

Proposição 9.7 Temos que P(a) ≈ 2a .

Demonstração: Seja b ⊆ a. Definimos a função gb : a−→2 pela regra: gb (x) =


{∅} se x ∈ b, e gb (x) = ∅ se x 6∈ b. Logo, h(b) = gb define uma função
h : P(a)−→2a . Por outro lado, h(b) = h(c) implica gb = gc , isto é, gb (x) = gb (x)
para todo x ∈ a. Portanto: gb (x) = {∅} sse gc (x) = {∅}, donde x ∈ b sse x ∈ c.
Por [A1] obtemos b = c, e então h é injetora. Por outro lado, se g ∈ 2a , considere
b = {x : x ∈ a ∧ g(x) = {∅}}. Logo b é legitimado por [A2], e claramente
h(b) = g. Daqui h é sobrejetora, e então h é uma bijeção entre P(a) e 2a . Assim
P(a) ≈ 2a . 

Vamos definir a continuação o conceito de ser menor ou igual em termos de


tamanho (obviamente estes conceitos são ainda difusos).

Definição 9.8 a  b denota (∃c)(c ⊆ b ∧ a ≈ c).

Proposição 9.9 (a) a ≈ b implica a  b.


(b) a ⊆ b implica a  b.
(c) a  a ∪ b.
(d) a  b e b  c implica a  c.

Demonstração: (a) Temos que a ≈ c com c = b ⊆ b. Logo a  b.


(b) A função I(a) produz: a ≈ c com c = a ⊆ b. Logo a  b.
(c) É uma conseqüência direta de (b).
(d) Suponha que a ≈ a1 (via f ) com a1 ⊆ b, e b ≈ b1 (via g) com b1 ⊆ c. Logo
g ◦ f é uma bijeção de a em g“a1 ⊆ c. Daqui a  c. 

O seguinte resultado, cuja demonstração é mais complicada, foi conjecturado


por Cantor e provado independientemente por Schröder e Bernstein em 1890.
A seguinte prova é devida a Fraenkel e Whitaker.

36
Teorema 9.10 (Cantor-Schröder-Bernstein)
Se a  b e b  a, então a ≈ b.

Demonstração: Seja f uma bijeção de a em b1 ⊆ b, e g uma bijeção de b em


a1 ⊆ a. Observe que o resultado (a ≈ b) estará provado se encontramos um
conjunto d ⊆ a tal que g|(b − f “d) é uma bijeção de b − f “d em a − d. Com
efeito, nesse caso teriamos que h = (f |d) ∪ (g −1 |(a − d)) é uma bijeção entre a
e b, como pode ser facilmente conferido usando a Proposição 8.7(f). O nosso
objetivo é portanto achar um conjunto d com a propriedade mencionada acima.
Para isso considere o conjunto

u = {c : c ⊆ a ∧ g“(b − f “(c)) ⊆ a − c}.

Dado que c ⊆ a sse c ∈ P(a), então u é legitimado por [A2].


Fatos: (1) Dados x, y ⊆ z, então: x ⊆ z − y sse y ⊆ z − x, e x = z − y sse
y = z − x. S
(2) Sejam z, y conjuntos. Se x ⊆ y para todo x ∈ z, então z ⊆ y.
S c1 ⊆ c2 ⊆ a, entãoSa − g“(b − f “c1 ) ⊆ a − g“(b − f “c2 ).
(3) Se
(4) u ⊆ a − g“(b − f “ u) (onde u é deinido como acima).
Com efeito:
(1) Suponha que x ⊆ z −y. Seja w ∈ y; logo, w ∈ z, pois y ⊆ z. Se w ∈ x, então
w ∈ z − y, isto é, w 6∈ y, uma contradição. Portanto w 6∈ x, donde w ∈ z − x e
então y ⊆ z − x. Simetricamente, y ⊆ z − x implica x ⊆ z − y. Para a segunda
parte, suponha que x = z − y; logo x ⊆ z − y e então, pela primeira parte,
y ⊆ z − x. Seja w ∈ z − x; se w 6∈ y, então w ∈ z − y = x. Mas w 6∈ x, por
hipótese. Esta contradição mostra que w ∈ y, isto é: z − x = y. A prova de
que y = z − x implica x = z − y é simétrica. S
(2) Assuma que x ⊆ y paraStodo x ∈ z, e seja w ∈ z. Logo w ∈ x para algum
S ∈ z, pela definição de z. Mas x ⊆ y, por hipótese; logo w ∈ y. Daqui
x
z ⊆ y.
(3) Se c1 ⊆ c2 ⊆ a, então f “c1 ⊆ f “c2 ⊆ b donde b − f “(c2 ) ⊆ b − f “(c1 ). Por-
tanto
g“(b − f “(c2 )) ⊆ g“(b − f “(c1 )) ⊆ a
e então a − g“(b − f “c1 ) ⊆ a − g“(b − f “c2 ).
(4) Seja c ∈ u; logo g“(b − f “(c)) ⊆ a − c e então, por (1),

c ⊆ a − g“(b − f “(c)). (∗)


S S
Por outro lado u ⊆ a, por (2). Além disso, S c ⊆ u: Scom efeito, se x ∈ c
então (x ∈ c) ∧ (c ∈ u) portanto S x ∈ u. De c ⊆ u ⊆ a infere-se Sque
a − g“(b − f “(c)) ⊆ a − g“(b − f “S u), por (3). Portanto
S c ⊆ a − g“(b − f “ u)
para todo c ∈ u, por (∗), donde u ⊆ a − g“(b − f “ u), por (2). Isto conclui
a prova dos Fatos. S S
Considere w = a − g“(b − f “ u). Por (4) temos que u ⊆ w ⊆ a, logo
[
w = a − g“(b − f “ u) ⊆ a − g“(b − f “w),

37
S
por (3). PorS(1) obtemos g“(b − f “w) ⊆ a − w, isto é, w ∈ u. Daqui w ⊆ u,
donde w = u. Isto é,
[ [
a − g“(b − f “ u) = u.
S S
PelaSsegunda parte de (1) obtemos g“(b − f “ u) = a − u. Vemos assim que
d = u satisfaz a propriedade requerida. 

Proposição 9.11 Se a  b e c  d, então:


(i) Se b ∩ d = ∅ então a ∪ c  b ∪ d;
(ii) a × c  b × d;
(iii) ac  bd se não é o caso que: a = b = c = ∅ e d 6= ∅.

Demonstração: Sejam f1 e f2 bijeções de a em b1 ⊆ b e de c em d1 ⊆ d,


respectivamente.
(i) Temos que a ∪ c = (a − c) ∪ c, com (a − c) ∩ c = ∅. Como b ∩ d = ∅, então
f1 “(a − c) ∩ d1 = ∅. Portanto h = (f1 |(a − c)) ∪ f2 é uma bijeção entre a ∪ c e
f1 “(a − c) ∪ d1 ⊆ b ∪ d.
(ii) Pela Proposição 9.4(b), a × c ≈ b1 × d1 ⊆ b × d.
(iii) a ≈ b1 e c ≈ d1 implicam que ac ≈ bd11 ⊆ bd1 , pela Proposição 9.5(a). A
prova estará terminada se encontrarmos uma injeção de bd1 em bd . O único
caso em que isto não é possı́vel é quando bd = ∅ e bd1 6= ∅, e é por isso que
a hipótese adicional (não é o caso que a = b = c = ∅ e d 6= ∅) foi colocada.
Com efeito, se bd = ∅, então d 6= ∅ e b = ∅, pela Proposição 8.11(d). Nesse caso
a = ∅. Agora, se d1 = ∅ (o que equivale a ter bd1 6= ∅), então c = ∅, donde
a = b = c = ∅ e d 6= ∅, contrariando a nossa hipótese. Logo d1 6= ∅ e então
bd1 = ∅, pela Proposição 8.11(d). Ou seja: bd = ∅ implica bd1 = ∅, e então
ac = ∅, donde ac  bd . Suponha finalmente que bd 6= ∅. Os casos bd1 = ∅ ou
d = ∅ implicam trivialmente que ac  bd . Suponha então que bd1 6= ∅ e d 6= ∅.
Dado que bd 6= ∅ e d 6= ∅, então b 6= ∅. Fixemos x0 ∈ b. Para f ∈ bd1 e x ∈ d,
defina


f (x) se x ∈ d1
h(f )(x) = .
x0 se x ∈ d − d1

Ou seja: h(f ) = f ∪ {hx, x0 i : x ∈ d − d1 }. Claramente h(f ) ∈ bd e então


h : bd1 −→bd é uma função. Observe que f ∩ {hx, x0 i : x ∈ d − d1 } = ∅ (pois
hx, yi ∈ f implica x ∈ d1 implica hx, yi 6∈ {hx, x0 i : x ∈ d − d1 }). Daqui
h(f ) = h(g) implica f = g, isto é, h é injetora. Seja g é uma bijeção entre ac
e bd11 (lembre que ac ≈ bd11 ). Daqui h ◦ g é uma bijeção de ac em h“(bd11 ) ⊆ bd ,
isto é, ac  bd . 

Definição 9.12 a ≺ b denota a  b ∧ ¬(b  a).

Proposição 9.13 (i) Não é o caso que a ≺ a.


(ii) Se a ≺ b então não é o caso que b ≺ a.
(iii) Se a ≺ b e b ≺ c então a ≺ c.

38
Demonstração: (i) Pela Definição 9.12, a ≺ a sse a  a e não é o caso que
a  a, uma contradição. Logo não é o caso que a ≺ a.
(ii) Assuma a ≺ b; isto implica que a  b e não b  a. Por outro lado, b ≺ a
equivale a b  a e não a  b. Portanto não podemos ter b ≺ a, pois a  b, por
hipótese.
(iii) Assuma a ≺ b e b ≺ c. Logo a  b e b  c, donde a  c. Se c  a, então
c  b, contrariando b ≺ c. Portanto não podemos ter c  a, donde a ≺ c. 

Estabeleceremos algumas relações entre  e ≺.

Proposição 9.14 (i) Se a  b então não b ≺ a.


(ii) Se a  b e b ≺ c então a ≺ c.
(iii) Se a ≺ b e b  c, então a ≺ c.
(iv) a  b sse a ≈ b ou a ≺ b.

Demonstração: (i) Pela Definição 9.12, b ≺ a implica que não a  b. Portanto


a  b implica b 6≺ a.
(ii) Assuma a  b e b ≺ c. Daqui a  b e b  c, donde a  c. Se c  a então
c  b, contrariando b ≺ c. Portanto não é o caso que c  a, donde a ≺ c.
(iii) Assuma a ≺ b e b  c. Como antes, obtemos a  c. Se c  a então b  a,
pois b  c; mas isto contraria a ≺ b. Portanto c 6 a, donde a ≺ c.
(iv) Assuma que a  b. Se a 6≺ b então, pela Definição 9.12, inferimos que
b  a ou a 6 b. Daqui obtemos que b  a e então, pelo Teorema 9.10, a ≈ b.
provamos desta maneira que a  b implica a ≈ b ou a ≺ b. Reciprocamente,
suponha que a ≈ b. Logo a  b. Se a ≺ b, então a  b, pela Definição 9.12.
Isto prova que a ≈ b ou a ≺ b implica a  b. 

Observe que o item (iv) da proposição acima justifica a denominação intuitiva


de menor ou igual para a relação .

Teorema 9.15 (Cantor) a ≺ P(a).

Demonstração: A função f (x) = {x} de a em P(a) é injetora, portanto


a  P(a). Suponha que a ≈ P(a) via uma função g : a−→P(a). Considere

b = {y : (y ∈ a) ∧ (y 6∈ g(y))}.

É claro que b é legitimado por [A2], e b ∈ P(a). Como g é sobrejetora, deve


existir algum x ∈ a tal que g(x) = b. Portanto:

x ∈ g(x) sse x 6∈ g(x).

Daqui inferimos que não pode existir uma tal g, isto é, a 6≈ P(a). Por outro
lado, observe que Teorema 9.10 pode ser refraseado como: a  b implica (a 6≈ b
implica b 6 a). Logo, de a  P(a) e a 6≈ P(a) inferimos, pelo Teorema 9.10,
que P(a) 6 a. Pela Definição 9.12, a ≺ P(a). 

39
10 Conjuntos Finitos
Estudaremos nesta seção os conjuntos finitos. A definição intuitiva de conjunto
finito é a seguinte: um conjunto a é finito se a tem n elementos, para algum
número natural n. Esta idéia é correta, mas utiliza o conceito de números
inteiros. Dedekind propôs em 1888 uma definição não numérica extremamente
elegante: um conjunto a é finito se a não é equipolente com nenhum subconjunto
próprio. Em outras palavras, os conjuntos finitos são exatamente aqueles em
que a parte é menor do que o todo. É evidente que esta definição pode ser
facilmente introduzida em ZF . O problema que envolve esta definição é que,
para provar que todo conjunto finito (no sentido de Dedekind) é finito (no
sentido usual), devemos usar o Axioma da Escolha [AE]. Este axioma, a ser
introduzido posteriormente, é o mais questionado dos axiomas da TC, existindo
inclusive TCs que rejeitam este princı́pio (de fato, na literatura são diferenciados
os sistemas ZF e ZF C, sendo que ZF C consiste de ZF com o acréscimo do
Axioma da Escolha). Tarski propôs em 1924 a seguinte definição de finitude a
qual, embora seja menos intuitiva, tem a vantagem que não requer [AE] para
provar a equivalência com a definição usual de finitude.

Definição 10.1 (i) min(x, u) denota x ∈ u ∧ (∀y)(y ∈ u → ¬(y ⊂ x))


(“x é um elemento minimal de u”).
(ii) max(x, u) denota x ∈ u ∧ (∀y)(y ∈ u → ¬(x ⊂ y))
(“x é um elemento maximal de u”).

Por exemplo, se b = {1, 2, 3, 4} e u ⊆ P(b), u = {{1, 2, 4}, {2}, {2, 4}, {1, 3}},
então {1, 2, 4} e {1, 3} são os elementos maximais de u, enquanto que {2} e
{1, 3} são os elementos minimais de u. Por outro lado, seja b = N e

Nn = N−{1, . . . , n−1} = {n, n+1, n+2, . . .} (n ∈ N); u = {Nn : n ∈ N} ⊆ P(b).

Dado que Nn ⊂ Nm se n > m, então u não tem elementos minimais. Esta é


a situação que caracteriza os conjuntos b infinitos, segundo a descoberta de
Tarski.

Definição 10.2 (Tarski) f in(b) denota a fórmula


(∀u)((u ⊆ P(b) ∧ (u 6= ∅)) → (∃z)min(z, u))
(“b é finito se toda famı́lia não vazia de subconjuntos de b possui um elemento
minimal”).

As primeiras propriedades simples da finitude são as seguintes:

Proposição 10.3 (i) ∅ é finito.


(ii) {x} é finito.
(iii) Se b é finito e c ⊆ b, então c é finito.
(iv) Se c é finito então c ∩ b e c − b são finitos.

Demonstração: (i) Observe que P(∅) = {∅}, portanto u = {∅} é a única


famı́lia não vazia de subconjuntos de ∅. É claro que ∅ é um elemento minimal
de u, portanto f in(∅).

40
(ii) Temos que P({x}) = {∅, {x}}. Logo, as únicas famı́lias não vazias de
subconjuntos de {x} são u1 = {∅}, u2 = {{x}}, e u3 = {∅, {x}}. É imediato que
todo conjunto da forma {z} tem um elemento minimal (o próprio z), portanto
u1 e u2 possuem elemento minimal. Finalmente, ∅ é o elemento minimal de u3 .
Isto prova f in({x}).
(iii) Assuma que b é finito, e seja c ⊆ b. Seja u ⊆ P(c), u 6= ∅. Logo u ⊆ P(b),
u 6= ∅. Dado que f in(b), então u possui um elemento minimal z. Daqui f in(c).
(iv) Suponha que c é finito. Para todo b temos que c − b ⊆ c e c ∩ b ⊆ c. Pelo
item (iii) obtemos que f in(c − b) e f in(c ∩ b). 

A seguinte propriedade exige uma demonstração um pouco mais complicada.


Proposição 10.4 Se c e b são finitos, então c ∪ b é finito.
Demonstração: Assuma f in(c) e f in(b). Seja u ⊆ P(c∪b), u 6= ∅. Provaremos
que u tem um elemento minimal. Considere

w = {a : a ⊆ c ∧ (∃d)((d ⊆ b) ∧ a ∪ d ∈ u)}.

Temos que w 6= ∅. Com efeito, seja z ∈ u. Dado que z = (z ∩ c) ∪ (z − c), então


a = z ∩ c e d = z − c satisfazem: a ⊆ c; d ⊆ b (pois z ⊆ c ∪ b); a ∪ d ∈ u. Logo
a é um elemento de w. Daqui w ⊆ P(c), w 6= ∅. Como c é finito, deve existir
a∗ ∈ w minimal. Logo

(1) a∗ ∈ w, a∗ ⊆ c.

Considere agora
w1 = {d : d ⊆ b ∧ (a∗ ∪ d ∈ u)}.
Por (1) temos que a∗ ∪d ∈ u para algum d ⊆ b, logo d ∈ w1 . Portanto w1 ⊆ P(b),
w1 6= ∅. Como b é finito existe um elemento minimal d∗ ∈ w1 , donde

(2) d∗ ∈ w1 , d∗ ⊆ b, a∗ ∪ d∗ ∈ u.

Provaremos que a∗ ∪d∗ é um elemento minimal de u. Suponha que s ∈ u tal que


s ⊆ a∗ ∪ d∗ . Daqui s ∩ a∗ ⊆ a∗ ⊆ c e s ∩ d∗ ⊆ d∗ ⊆ b. Dado que s ⊆ a∗ ∪ d∗ , então

(3) s = s ∩ (a∗ ∪ d∗ ) = (s ∩ a∗ ) ∪ (s ∩ d∗ ).

Como s ∈ u obtemos que s ∩ a∗ ∈ w, e s ∩ a∗ ⊆ a∗ . Dado que a∗ é minimal,


inferimos s ∩ a∗ = a∗ . Por (3) obtemos que a∗ ∪ (s ∩ d∗ ) ∈ u, donde s ∩ d∗ ∈ w1 .
Logo s∩d∗ = d∗ , pois d∗ é minimal. Usando (3) vemos que s = a∗ ∪d∗ . Portanto
a∗ ∪ d∗ é um elemento minimal de u. Isto prova que c ∪ b é finito. 

Corolário 10.5 Se b é finito, então b ∪ {x} é finito.

Podemos definir um princı́pio de indução para conjuntos finitos. Antes disso,


provaremos que existe uma caracterização da finitude em termos de conjuntos
maximais.

41
Proposição 10.6 (a) Toda famı́lia não vazia de subconjuntos de um conjunto
finito possui um elemento maximal.
(b) Se toda famı́lia não vazia de subconjuntos de um conjunto b possui um
elemento maximal, então b é finito.

Demonstração: (a) Dado a finito, seja u ⊆ P(a), u 6= ∅. Considere v =


{a − x : x ∈ u}. Claro que v é legitimado por [A2], v ⊆ P(a), e v 6= ∅ (pois
u 6= ∅). Como a é finito, existe a − x ∈ v minimal, onde x ∈ u. Provaremos que
x é maximal em u. Para isto, observe que

(1) para todo w, y ⊆ a temos que: y ⊂ w sse a − w ⊂ a − y.

A prova é simples, e é deixada como exercı́cio. Suponha então que x não é


maximal em u. Logo, deve existir y ∈ u tal que x ⊂ y. Por (1) obtemos
a − y ⊂ a − x, onde a − y ∈ v. Isto contradiz a minimalidade de a − x em v,
portanto x é maximal.
(b) A prova é análoga à do item anterior. Assim, considere u ⊆ P(b), u 6= ∅.
Logo
v = {b − x : x ∈ u}
é uma famı́lia não vazia de subconjuntos de b. Por hipótese, existe um elemento
maximal b − x em v, com x ∈ u. Utilizando (1) vemos que x é minimal em u,
portanto b é finito. 

Teorema 10.7 Seja ϕ(b) uma fórmula em que b ocorre livre e nem c nem x
ocorrem livres (outras variáveis podem ocorrer livres em ϕ). Suponha o seguinte:
(i) c é finito;
(ii) ϕ(∅);
(iii) (∀x)(∀b)(((x ∈ c) ∧ (b ⊆ c) ∧ ϕ(b)) → ϕ(b ∪ {x})).
Então ϕ(c).

Demonstração: Considere u = {b : b ⊆ c ∧ ϕ(b)}. Logo u ⊆ P(c) e u 6= ∅


pois ∅ ∈ u, pela hipótese (ii). Dado que c é finito, por (i), então existe b ∈ u
maximal, pela Proposição 10.6(a). Provaremos que b = c, e logo ϕ(c) como
queriamos. Por redução ao absurdo, suponha que b 6= c. Como b ⊆ c, deve
existir x ∈ c − b. Por (iii), temos que ϕ(b ∪ {x}) e então b ∪ {x} ∈ u, sendo que
b ⊂ b ∪ {x}. Isto contradiz a maximalidade de b em u. Daqui b = c e ϕ(c). 

Em particular, obtemos a seguinte formulação conjuntista do princı́pio de indução


para conjuntos finitos:

Teorema 10.8 Suponha o seguinte:


(i) c é finito;
(ii) ∅ ∈ w;
(iii) (∀x)(∀b)(((x ∈ c) ∧ (b ⊆ c) ∧ b ∈ w) → b ∪ {x} ∈ w).
Então c ∈ w.

42
Demonstração: Basta considerar no Teorema 10.7 a fórmula ϕ(b) como sendo
“b ∈ w”. 

Observe que o Teorema 10.7 é uma conseqüência do Teorema 10.8 considerando


w = {b : (b ∈ P(c)) ∧ ϕ(b)} (legitimado por [A2]). Daqui, os Teoremas 10.7
e 10.8 são equivalentes. De fato, as propriedades (ii) e (iii) do Teorema 10.8
caracterizam os conjuntos finitos, como provaremos a seguir.

Proposição 10.9 c é finito sse c pertence a todo w satisfazendo as condições


(ii) e (iii) do Teorema 10.8.

Demonstração: Se c é finito, então a conclusão vale pelo Teorema 10.8. Reci-


procamente, assuma que c ∈ w para todo w satisfazendo as condições (ii) e (iii)
do Teorema 10.8. Seja w o conjunto de todos os subconjuntos finitos de c (w
é legitimado por [A2]; confira!). Pela Proposição 10.3(i) temos que ∅ ∈ w. Se
b ∈ w e x ∈ c então b ∪ {x} ∈ w pelo Corolário 10.5. Portanto w satisfaz as
condições (ii) e (iii) do Teorema 10.8, donde c ∈ w. Isto é, c é finito. 

Proposição 10.10 Se c é finito e f é uma função com domı́nio c e imagem b,


então b é finito.

Demonstração: Seja w = {a : (a ⊆ c) ∧ f in(f “a)}. Provaremos pelo Teo-


rema 10.8 que c ∈ w, donde im(f ) = f “c resultará ser finito. Observe que
∅ ⊆ c e f “∅ = ∅ (finito); então ∅ ∈ w. Seja x ∈ c e a ∈ w; logo a ∪ {x} ⊆ c.
Como f é função, então f “{x} = {f (x)}, logo f “{x} é finito, pela Propo-
sição 10.3(ii). Daqui f “(a ∪ {x}) = f “a ∪ f “{x} é finito, pela Proposição 10.4,
e então a ∪ {x} ∈ w. Pelo Teorema 10.8 temos que c ∈ w, portanto im(f ) é
finito. 

Proposição 10.11 Se c é finito, então P(c) é finito.

Demonstração: Considere w = {b : b ⊆ c ∧ f in(P(b))}. Temos que ∅ ∈ w.


Suponha b ∈ w e x ∈ c. Se x ∈ b então b ∪ {x} ∈ w. Se x 6∈ b, então b ∪ {x} ⊆ c.
Defina
f = {ha, a ∪ {x}i : a ∈ P(b)}.
Temos que f é legitimado por [A2], e f é função com domı́nio P(b) (finito). Pela
Proposição 10.10 temos que a imagem de f é finita. Seja z = P(b ∪ {x}) − P(b).
Provaremos que im(f ) = z. Com efeito, dado a ∈ P(b), temos que a ∪ {x} ∈ z,
pois x 6∈ b. Logo im(f ) ⊆ z. Por outro lado, se d ∈ z, então x ∈ d, d − {x} ∈
P(b) e d = (d − {x}) ∪ {x}. Daqui f (d − {x}) = d, portanto d ∈ im(f ).
Provamos então que z = im(f ) é finito. Mas P(b ∪ {x}) = z ∪ P(b), portanto
P(b ∪ {x}) é finito, pela Proposição 10.4. Desta maneira b ∪ {x} ∈ w, donde
c ∈ w, isto é, P(c) é finito. 

S
Proposição 10.12 Se c é finito e todo x ∈ c é finito, então c é finito

43
S
Demonstração: Considere w = {b : b ⊆ c ∧ f in( b)} (legitimado por [A2]). S
Claramente ∅ ∈ w. Seja b ∈ w e x ∈ c. Logo x é finito, por hipótese, e b é
finito, pela hipótese de indução (b ∈ w). É fácil provar que
[ [
(b ∪ {x}) = ( b) ∪ x
S
(exercı́cio). Portanto (b ∪ {x}) é finito, pela Proposição 10.4, e então b ∪ {x}
S ∈
w (claramente b ∪ {x} ⊆ c). Pelo Teorema 10.8 obtemos c ∈ w, isto é, c é
finito. 

Proposição 10.13 Se P(c) é finito, então c é finito.


Demonstração: Seja b = {{x} : x ∈ c} (legitimado por [A2]). Como P(c) é
finito e b ⊆ P(c), então a Proposição 10.3(iii) assegura que b é finito. Como todo
elemento de Sb é da forma {x} (portanto finito)S então a Proposição 10.12 S nos
garante que b é finito. Mas é fácil provar que b = c. Com efeito: se y ∈ b,
então existe x ∈ c tal que y ∈ {x}, isto é, y = x dondeS y ∈ c. Reciprocamente,
se x ∈ c então x ∈ {x} onde {x} ∈ b, portanto x ∈ b. Logo, c é finito. 

Proposição 10.14 (i) Se c é finito e c ≈ b então b é finito.


(ii) Se c é finito e b  c então b é finito.
Demonstração: (i) Seja f uma bijeção de c em b. Como c é finito então im(f )
é finito, pela Proposição 10.10. Mas im(f ) = b.
(ii) Se b  c, então b ≈ a onde a ⊆ c. Se c é finito, então a é finito. Logo a ≈ b
e a é finito, donde b é finito, pelo item (i). 

A Lei de Tricotomia estabelece: para todo par de conjuntos c,b, temos que vale
uma e só uma das seguinte possibilidades: c ≺ b, b ≺ c, ou c ≈ b. Pode ser
provado que a Tricotomia equivale ao Axioma da Escolha. Porém, se um dos
conjuntos é finito, não precisamos de [AE] para provar esta propriedade.
Proposição 10.15 Se c é finito então c ≺ b, b ≺ c, ou c ≈ b.
Demonstração: Faremos indução sobre os subconjuntos de c. Dado b, con-
sidere
w = {a : a ⊆ c ∧ ((a ≺ b) ∨ (b ≺ a) ∨ (a ≈ b))}.
Claramente ∅ ∈ w pois, se b = ∅, então ∅ ≈ b e, se b 6= ∅, então ∅ ≺ b. Seja
a ∈ w e x ∈ c; queremos provar que a ∪ {x} ∈ w. O caso em que x ∈ a é óbvio.
Assumamos que x 6∈ a. Como a ∈ w, então temos três casos:
Caso 1: a ≺ b. Logo, existe y ∈ b − im(f ), onde f é uma função injetora de a
em b. Portanto, g = f ∪ {hx, yi} é uma função injetora de a ∪ {x} em b, donde
a∪{x}  b. Daqui inferimos a∪{x} ≺ b ou a∪{x} ≈ b, pela Proposição 9.14(iv).
Nos dois casos, a ∪ {x} ∈ w.
Caso 2: b ≺ a. Como a  a ∪ {x}, então b ≺ a ∪ {x}, pela Proposição 9.14(iii).
Portanto a ∪ {x} ∈ w.
Caso 3: b ≈ a. Como a ⊆ a∪{x}, então a ≈ a∪{x} ou a ≺ a∪{x}. No primeiro
caso b ≈ a ∪ {x}; no segundo caso b ≺ a ∪ {x}. Nos dois casos a ∪ {x} ∈ w.
Em virtude do Teorema 10.8, c ∈ w, isto é, c ≺ b, b ≺ c, ou c ≈ b. 

44
Corolário 10.16 Se c é finito e b não é finito, então c ≺ b.

Demonstração: Temos que c ≺ b, b ≺ c ou c ≈ b. Os dois últimos casos


implicam a existência de uma bijeção f de a ⊆ c em b. Mas a é finito, portanto
b = im(f ) é finito, o que contradiz a hipótese. Logo, só pode ser c ≺ b. 

Provaremos agora que um conjunto finito (no sentido Tarski) é um conjunto


finito (no sentido Dedekind). Como mencionamos anteriormente, toda prova
conhecida da afirmação recı́proca precisa do [AE].

Definição 10.17 Dedf in(c) denota ¬(∃b)(b ⊂ c ∧ c ≈ b)


(“c é Dedekind-finito se não é equipolente com nenhum subconjunto próprio”).

Teorema 10.18 Se c é finito, então c é Dedekind-finito.

Demonstração: Seja c finito, e suponha que c não é Dedekind-finito. Logo,


existe b ⊂ c tal que c ≈ b (via uma bijeção f de c em b). Considere

u = {a : a ⊆ c ∧ f “a ⊂ a}.

Como c ⊆ c e f “c = b ⊂ c, então c ∈ u, logo u 6= ∅. Como c é finito e u ⊆ P(c)


é não vazio, existe um elemento minimal d em u. Dado que f “d ⊂ d e d é
minimal, então

(1) f “d 6∈ u.

Por outro lado f “d ⊂ d implica que existe x ∈ (d−f “d). Note que f “(f “d) ⊆ f “d.
Se f (x) ∈ f “(f “d), então f (x) = f (y) com y ∈ f “d. Mas f é injetora,
portanto f (x) = f (y) implica x = y, isto é, x ∈ f “d, uma contradição.
Logo f (x) ∈ f “d − f “(f “d), donde f “(f “d) ⊂ f “d. Daqui (e do fato de ter
f “d ⊂ d ⊆ c) inferimos f “d ∈ u, em contradição com (1). Portanto a suposição
inicial é falsa e então c é Dedekind-finito. 

Proposição 10.19 Sejam c e b finitos.


(i) c × b é finito.
(ii) cb é finito.

Demonstração: (i) Sejam c e b finitos. Se c = ∅ ou b = ∅ então c × b = ∅ é


finito. Se c e b são não vazios, então
[
c×b= a, a = {c × {y} : y ∈ b}.

Dado que c ≈ c × {y}, então todo elemento de a é S finito. Claramente a ≈ b,


donde a é finito. Pela Proposição 10.12 o conjunto a é finito, isto é, c × b é
finito.
(ii) Temos que cb ⊆ P(b × c). Como b × c é finito, pelo item (i), então P(b × c)
é finito, donde cb é finito. 

45
11 Axiomas Finais de ZF . O Axioma da Escolha
Para definir a noção de ordinal precisaremos de acrescentar axiomas adicionais
ao sistema S. A seguir completaremos a definição do sistema ZF , estudando as
conseqüências da incorporação dos mesmos. O primeiro axioma a ser incorpo-
rado ao nosso sistema atual é o Axioma da Infinidade, que assegura a existência
de un conjunto infinito.

Axioma da Infinidade:

[A6] (∃w)((∅ ∈ w) ∧ (∀x)(x ∈ w → x ∪ {x} ∈ w))

Por definição temos que ∅ ∈ w, portanto

{∅} = ∅ ∪ {∅} ∈ w;
{∅, {∅}} = {∅} ∪ {{∅}} ∈ w;
{∅, {∅}, {∅, {∅}}} = {∅, {∅}} ∪ {{∅, {∅}}} ∈ w; etc.

Dado que {x} e logo x ∪ {x} só aparece num nı́vel posterior ao nı́vel em que foi
criado x, então [A6] exige a existência de uma seqüência crescente infinita de
nı́veis na estrutura cumulativa de tipos, sendo que w aparece só depois de todos
esses nı́veis. Este axioma é a primeira tentativa de afirmar que os nı́veis não
têm fim. Portanto, esta afirmação pode ser aceita por alguns matemáticos e re-
jeitada por outros. É fundamental perceber que este axioma separa claramente
a Aritmética (que pode ser realizada sem assumir a existência de seqüências
infinitas) de outras disciplinas da Matemática avanzada, tais como Análise, que
fazem um uso essencial do Axioma da Infinidade.
A seguir introduziremos um axioma importantı́ssimo, o Axioma de Substi-
tuição. Não só obteremos o Axioma de Separação como um corolário, senão
que poderemos assegurar a existência de ordinais e cardinais transfinitos.

Axioma de Substituição: Seja ψ(x, y) uma fórmula com x e y livres, mas


onde b não ocorre livre (outras variáveis podem ocorrer livres em ψ). Seja z uma
variável nova, e F U Nψ a fórmula (∀x)(∀y)(∀z)(ψ(x, y) ∧ ψ(x, z) → (y = z)).

[A7] F U Nψ → (∃b)(∀y)(y ∈ b ↔ (∃x)(x ∈ a ∧ ψ(x, y)))

A hipótese F U Nψ indica que ψ define uma função parcial, isto é: para cada x,
existe no máximo um y tal que ψ(x, y). Assumindo F U Nψ , então [A7] assegura
que o termo s dado por

s = {y : (∃x)((x ∈ a) ∧ ψ(x, y))}

é legitimado; ele representa a imagem de a sob a função parcial definida por


ψ(x, y); se o termo r dado por

r = {hx, yi : ψ(x, y)}

46
é legitimado, então s é r“(a) = im(r|a). Dado que r não é necessariamente legi-
timado, devemos esperar que [A7] acrescente novos conjuntos. Observe que [A7]
é um esquema de axioma, definindo um axioma particular para cada fórmula
ψ. Ele afirma que, dado a, podemos substituir os seus elementos por outros
conjuntos, desde que coloquemos no máximo um conjunto para cada elemento
de a.
Em termos da teoria cumulativa de tipos, isto afirma que os nı́veis não têm
fim. De fato, é a afirmação mais forte em ZF nessa direção. Assim, [A7] afirma
que toda coleção de nı́veis colocados em correspondência com os elementos de
um conjunto pode ser considerada como completada, portanto existem nı́veis
superiores. Mais precisamente, seja f (x) o nı́vel em que aparece y tal que
ψ(x, y) (se não existir y então f (x) pode ser tomado como o primeiro nı́vel).
Logo, a coleção de nı́veis f (x) está em correspondência com os elementos de a,
portanto existe um nı́vel em que todos os y tais que ψ(x, y) para algum x ∈ a
já foram criados. Nesse nı́vel pode ser criado b = {y : (∃x)((x ∈ a) ∧ ψ(x, y))}.
Observe que [A7] fornece um axioma para cada fórmula ψ apropriada; isto
limita o poder de [A7], da mesma maneira que acontece con [A2]. Por outro
lado, [A2] é um caso particular de [A7]:

Proposição 11.1 Seja φ(x) uma fórmula em que x ocorre livre mas b não
ocorre livre. Logo,

[A7] ` (∃b)(∀x)(x ∈ b ↔ ((x ∈ a) ∧ φ(x))).

Em outras palavras, [A2] é implicado por [A7].

Demonstração: Seja y uma variável nova (isto é, y não ocorre em φ(x) e
y 6= b). Considere ψ(x, y) dada por

ψ(x, y) ≡def φ(x) ∧ (x = y).

Pelas regras da igualdade, provamos a fórmula

(∗) (∃x)((x ∈ a) ∧ ψ(x, y)) ↔ (y ∈ a) ∧ φ(y).

Por outro lado, é fácil provar que ψ(x, y) e ψ(x, z) implica y = z. Logo F U Nψ
donde, por [A7], inferimos que (∃b)(∀y)(y ∈ b ↔ (∃x)((x ∈ a) ∧ ψ(x, y)). Por
(∗) obtemos
(∃b)(∀y)(y ∈ b ↔ ((y ∈ a) ∧ φ(y))),
isto é, [A2]. 

Provaremos agora que o axioma [PR] pode ser deduzido dos axiomas [A3] e
[A7], conforme anunciado na Seção 2.

Proposição 11.2 [A3], [A7] ` [PR].

Demonstração: Primeiro obtemos o seguinte:

47
Fato 1: [A7] ` (∃c)(∀u)(u 6∈ c).
Com efeito, basta tomar ψc (x, y) ≡def (x 6= x) ∧ (x = y) em [A7], e a uma
variável qualquer (exercı́cio).
Fato 2: [A3], [A7] ` (∃d)(∀x)(x ∈ d ↔ (∀w)(w ∈ x → (∀u)(u 6∈ w)).
Com efeito, basta tomar c como no Fato 1 e depois aplicar [A3] no conjunto c,
obtendo o conjunto d com as propriedades requeridas (exercı́cio).
Fato 3: Dados a e b considere a fórmula

ψa,b (x, y) ≡def ((∀w)(w 6∈ x) ∧ y = a)


∨ ((∃w)(w ∈ x) ∧ (∀w)(w ∈ x → (∀u)(u 6∈ w)) ∧ y = b).

Então F U Nψa,b (exercı́cio).


Fato 4: Usando apenas lógica clássica temos que

(∃x)((∀w)(w ∈ x → (∀u)(u 6∈ w)) ∧ ψa,b (x, y)) ↔ (y = a ∨ y = b)

(exercı́cio).

Logo, pelo Fato 3 e por [A7] temos que

(∃z)(∀y)(y ∈ z ↔ (∃x)(x ∈ d ∧ ψa,b (x, y))).

Finalmente, tomando d como no Fato 2 obtemos, pelo Fato 4, que

(∃z)(∀y)(y ∈ z ↔ (y = a ∨ y = b)).

Definição 11.3 O sistema ZF da Teoria de Conjuntos consiste do axioma


[A1] junto com os axiomas [A3]-[A7]. 1

Uma vez que introduzimos a totalidade dos axiomas de TC, discutiremos o Ax-
ioma da Escolha ([AE]), que originou uma das principais discussões dentro da
Teoria de Conjuntos. O sistema obtido de ZF acrescentando [AE] é usualmente
denotado por ZFC. Uma possı́vel formulação de [AE] é a seguinte:

Axioma da Escolha:

[AE] ((∀x)(x ∈ z → x 6= ∅) ∧ (∀x)(∀y)(((x, y ∈ z) ∧ (x 6= y))


→ x ∩ y = ∅)) → (∃u)(∀x)(∃v)(x ∈ z → u ∩ x = {v})

Isto é: dado um conjunto z cujos elementos são não vazios e dois a dois disjuntos,
então existe um conjunto de escolhas u, que tem exatamente um membro em
comum com cada elemento de z. Observe que, embora u “escolha” um e-
lemento de cada membro de z, o axioma nada diz respeito à existência de um
procedimento efetivo para realizar esta escolha.
1
Dado que, pela Proposição 11.1 o axioma [A2] é derivável em ZF , continuaremos a utilizá-
lo no resto do texto, embora não seja parte da axiomática de ZF .

48
O caráter altamente não construtivo deste axioma foi alvo de crı́ticas por
parte das escolas matemáticas construtivistas. Porém, a quantidade de aplicações
fundamentais de [AE] dentro de TC como na Matemática em geral fazem de
[AE] um axioma praticamente imprescindı́vel. Em TC é necessário [AE], por
exemplo, para obter a Lei de Tricotomia para conjuntos. Existe uma série de
importantes resultados matemáticos relacionados com o Axioma de Escolha,
por exemplo: o Teorema de Hahn-Banach, o Teorema de Ideais Primos para
Álgebras de Boole, a existência de bases em espaços vetoriais, e o Teorema de
Tychonoff (o produto de espaços topológicos compactos é compacto). Estes
dois últimos resultados são de fato equivalentes a [AE], assim como os seguintes
Princı́pios:
Princı́pio da Boa Ordem: Todo conjunto admite uma boa ordem.
Lema de Zorn: Seja A um conjunto ordenado tal que todo subconjunto total-
mente ordenado (ou cadeia) B tem um limitante superior. Então, A tem um
elemento maximal.
A não-construtividade embutida em [AE] pode ser entendida através do
seguinte exemplo intuitivo, devido a Bertrand Russell:

Exemplo 11.4 Considere uma coleção z de pares de sapatos idênticos. Nesse


caso, é possı́vel escolher sem problemas um único elemento (sapato) de cada par
de sapatos de z, por exemplo através do algoritmo “pegue apenas os sapatos
que correspondam ao pé direito”. Por outro lado, se agora consideramos uma
coleção z 0 de pares de meias idênticas (não existindo nenhuma diferença entre
a meia do pé direito e a do pé esquerdo), não existe um método imaginável
que permita escolher apenas uma meia de cada par de z 0 . Porém, o Axioma da
Escolha garante que é possı́vel fazer isto! 

12 Introdução aos Ordinais


Embora os axiomas de ZF não mencionam explicitamente a existência dos nı́veis
da teoria cumulativa de tipos, eles são fortes o suficiente como para permitir
a sua definição. Os ordinais permitirão indexar os nı́veis (além de ter muitas
outras aplicações).

Definição 12.1 (von Neumann) transi(x) denota


(∀y)(∀z)((y ∈ z) ∧ (z ∈ x) → (y ∈ x))
(“x é transitivo”);
conec(x) denota (∀y)(∀z)(y, z ∈ x → ((y ∈ z) ∨ (z ∈ y) ∨ (y = z)))
(“x é conectado com relação a ∈”);
ord(x) denota transi(x) ∧ conec(x)
(“x é um ordinal”);
x < y denota ord(x) ∧ ord(y) ∧ x ∈ y
(“x é um ordinal menor que y”);
x ≤ y denota ord(x) ∧ ord(y) ∧ (x < y ∨ x = y).

Teorema 12.2 Utilizando os axiomas [A1], [A2], [A4], [A5], [PR] provamos o
seguinte:

49
(i) Se x é ordinal e y ∈ x, então y é ordinal.
(ii) ∅ é ordinal.
(iii) Se x é ordinal, então x ∪ {x} é ordinal.

Demonstração: (i) Fixe um ordinal x, e y ∈ x. Sejam u, v ∈ y. Como x é


transitivo e y ∈ x, então u, v ∈ x. Como x é conectado com relação a ∈, então
u ∈ v ou v ∈ u ou u = v. Daqui y é conectado. Para provar que y é transitivo
devemos utilizar o axioma da regularidade. Sejam então u ∈ z, z ∈ y. Como
y ∈ x e x é transitivo, obtemos que u ∈ x. Logo, de conec(x) deduzimos: y ∈ u
ou y = u ou u ∈ y. Queremos eliminar as duas primeiras possibilidades.
Caso 1: y ∈ u. Temos então: u ∈ z, z ∈ y, y ∈ u. Considere a = {u, y, z}
Logo:
y ∈ u ∩ a, z ∈ y ∩ a, u ∈ z ∩ a.
Logo, a 6= ∅ não tem nenhum elemento disjunto com a, contrariando o axioma
da regularidade. Portanto, não podemos ter y ∈ u.
Caso 2: y = u. Temos então: u ∈ z, z ∈ y, y = u; isto é, y ∈ z, z ∈ y. Mas, na
Proposição 3.6(2) provamos que [A5] implica: ¬(a ∈ b ∧ b ∈ a). Portanto não
podemos ter y = u.
Assim u ∈ y, donde transi(y). Daqui y é ordinal.
(ii) Todas as hipóteses são falsas, logo ∅ é trivialmente um ordinal.
(iii) Seja y = x ∪ {x}. Observe que

(∗) z ∈ y sse z ∈ x ou z = x.

Para provar que y é transitivo sejam u ∈ z e z ∈ y; queremos obter u ∈ y. Por


(∗) temos dois casos a partir da hipótese z ∈ y:
Caso 1: z ∈ x. Logo u ∈ z, z ∈ x implica u ∈ x, pois transi(x). Daqui u ∈ y,
por (∗).
Caso 2: z = x. Logo u ∈ z, z = x implica u ∈ x. Portanto u ∈ y, por (∗).
Provamos assim transi(y). Para provar que y é conectado considere u ∈ y,
z ∈ y; queremos obter z ∈ u ou u ∈ z ou z = u. Por (∗) inferimos a partir de
u, z ∈ y:
Caso 1: u ∈ x.
Caso 1.1: z ∈ x. Daqui u ∈ x, z ∈ x implica z ∈ u ou u ∈ z ou z = u, pois
conec(x).
Caso 1.2: z = x. Logo u ∈ x, x = z implica u ∈ z, donde z ∈ u ou u ∈ z ou
z = u.
Caso 2: u = x.
Caso 2.1: z ∈ x. Daqui z ∈ x, x = u implica z ∈ u, logo z ∈ u ou u ∈ z ou
z = u.
Caso 2.2: z = x. Logo u = x, x = z implica u = z, portanto z ∈ u ou u ∈ z
ou z = u.
Provamos então que y é conectado, sendo portanto um ordinal. 

Definição 12.3 Introduzimos a notação seguinte:


0 denota ∅;

50
1 denota {∅};
2 denota {∅, {∅}};
3 denota {∅, {∅}, {∅, {∅}}};
em geral, n denota {0, 1, 2, ..., n − 1};
x + 1 denota x ∪ {x} (o sucessor de x).

Podemos provar agora a lei de tricotomia para ordinais (não confundir com a lei
de tricotomia enunciada anteriormente!). Esta propriedade é de fundamental
importância.

Teorema 12.4 Se x e y são ordinais, então: x ∈ y ou y ∈ x ou x = y.

Demonstração: Provaremos primeiro o seguinte


Fato: Se x e y são ordinais e x ⊂ y, então x ∈ y.
Com efeito: Seja z = y − x. Logo z 6= ∅, portanto existe u ∈ z tal que u ∩ z = ∅,
pelo axioma da regularidade. Logo u ∈ y, u 6∈ x. Como u ∩ z = ∅, então v ∈ u
implica v 6∈ z, isto é, v 6∈ y ou v ∈ x ou, equivalentemente, (v ∈ y → v ∈ x). Ou
seja: v ∈ u implica (v ∈ y → v ∈ x). Como y é transitivo e u ∈ y, então v ∈ u
implica v ∈ y. Como também temos (v ∈ y → v ∈ x), então deduzimos v ∈ x.
Ou seja: v ∈ u implica v ∈ x, donde u ⊆ x. Por outro lado, seja w ∈ x; como
x ⊆ y, então w ∈ y. Dado que u ∈ y e y é conectado, então u = w ou u ∈ w
ou w ∈ u. Se u = w, então de w ∈ x inferimos u ∈ x, contradição (u ∈ y − x).
Se u ∈ w então: u ∈ w, w ∈ x implica u ∈ x (pois x é transitivo), contradição.
Portanto só podemos ter w ∈ u. Assim: w ∈ x implica w ∈ u, donde x ⊆ u.
Desta maneira u = x. Como u ∈ y, então x ∈ y, provando o Fato.
Sejam então x e y ordinais. É muito simples provar que z = x ∩ y é também
um ordinal (exercı́cio). Se z 6= x e z 6= y, então z ⊂ x e z ⊂ y, donde z ∈ x e
z ∈ y, pelo Fato. Daqui z ∈ x ∩ y, isto é, z ∈ z, contradição. Logo z = x ou
z = y. Se z = x, então x ⊆ y. Se x = y, vale a tricotomia. Se x ⊂ y, então
x ∈ y, pelo Fato, donde vale a tricotomia. O caso z = y é similar. 

Corolário 12.5 (“Paradoxo” de Burali-Forti) O termo {x : ord(x)} não


é legitimado.

Demonstração: Suponha que definimos On = {x : ord(x)}. Provaremos


que On é um ordinal, portanto On ∈ On, uma contradição. Com efeito, pelo
Teorema 12.2(i) obtemos que On é transitivo. Pelo Teorema 12.4 inferimos que
On é conectado. Daqui ord(On). 

Desde o ponto de vista da teoria cumulativa de tipos, esperamos ter só um


ordinal em cada nı́vel (isto será provado depois). Logo, On não poderia ser
jamais completado.

Definição 12.6 Usaremos as letras gregas α, β, γ, etc., eventualmente com


subı́ndices (mas não φ, ψ, as quais são reservadas para denotar fórmulas),
como variáveis para indicar ordinais. Além disso,
(∀α)φ(α) denotará (∀α)(ord(α) → φ(α));
(∃α)φ(α) denotará (∃α)(ord(α) ∧ φ(α)), e

51
{α : φ(α)} denotará {α : ord(α) ∧ φ(α)}.
A definição da quantificação (∀α) e (∃α) é correta, pois existem ordinais.

Definição 12.7 suc(x) denota ord(x) ∧ ((∃y)(x = y + 1) ∨ (x = 0))


(“x é zero ou um ordinal sucessor”);
lim(x) denota ord(x) ∧ ¬suc(x)
(“x é um ordinal limite”);
int(x) denota suc(x) ∧ (∀y)(y < x → suc(y))
(“x é um enteiro não negativo”).

Se x é um ordinal sucessor da forma x = y + 1, então y ∈ x, pela definição


de y + 1. Pelo Teorema 12.2(i), temos que y é também um ordinal. Portanto
y + 1 é um ordinal sse y é um ordinal. Não existe razão para considerar 0 como
sucessor ou limite, mas ele é incluido no conjunto dos sucessores. Observe que
vale a seguinte propriedade:

[LIM] lim(x) ↔ ord(x) ∧ (x 6= 0) ∧ (∀y)(y ∈ x → y + 1 ∈ x).

Com efeito, lim(x) implica ord(x) e ¬ord(x) ∨ (¬(∃y)(x = y + 1) ∧ x 6= 0). Logo


ord(x), x 6= 0 e (∀y)(x 6= y + 1). Seja y ∈ x; como ord(y), então ord(y + 1)
donde, por tricotomia, y + 1 < x ou y + 1 = x ou x < y + 1. Não podemos ter
x = y+1. Por outro lado, x < y+1 implica: x = y (portanto x ∈ x, contradição)
ou x ∈ y (portanto x ∈ y e y ∈ x, contradição). Logo y +1 < x, isto é, y +1 ∈ x.
Reciprocamente, suponha ord(x), x 6= 0, (∀y)(y ∈ x → y + 1 ∈ x). Se x = y + 1,
então y ∈ x, donde y + 1 ∈ x, isto é, x ∈ x, contradição. Logo x 6= y + 1 para
todo y donde x é ordinal limite.
Provaremos que um princı́pio fraco de indução matemática para os inteiros é
válido no sistema S (lembre da Definição 3.5).
Teorema 12.8 (Indução Matemática) Para cada fórmula ψ da linguagem
de ZF, temos que:

S ` (ψ(0) ∧ (∀α)(ψ(α) → ψ(α + 1))) → (∀α)(int(α) → ψ(α)).

Demonstração: Suponhamos que a conclusão do princı́pio de indução é falsa;


provaremos que a hipótese é falsa. Assim, assumamos que existe um ordinal
β tal que int(β) ∧ ¬ψ(β). Observe que, dados ordinais γ e β, então γ ≤ β sse
γ = β ou γ ∈ β sse γ ∈ β + 1. Portanto, por [A2] podemos criar o conjunto

y = {γ : γ ≤ β ∧ ¬ψ(γ)} = {γ : (γ ∈ β + 1) ∧ ¬ψ(γ)}.

Por outro lado y 6= ∅, pois β ∈ y. Pelo axioma da regularidade existe γ0 ∈ y tal


que γ0 ∩ y = ∅. Dado que γ0 ≤ β e int(β), então suc(γ0 ). Com efeito: γ0 = β
implica int(γ0 ), logo suc(γ0 ). Por outro lado, γ0 < β implica suc(γ0 ), pela
definição de int(β). Dado que suc(γ0 ), então
Caso 1: γ0 = 0. Daqui ¬ψ(0), pois γ0 ∈ y.
Caso 2: γ0 = γ1 +1 para algum γ1 (que resulta ser um ordinal, pela observação
após a Definição 12.7). Como γ1 ∈ γ0 e γ0 ∩ y = ∅, então γ1 6∈ y. Daqui ψ(γ1 ),
pois γ1 ≤ β. Isto é: ψ(γ1 ) ∧ ¬ψ(γ1 + 1).

52
Vemos que cualquer dos casos acima contraria a hipótese do princı́pio de indução.


O princı́pio de indução 12.8 é mais fraco do que a indução utilizada freqüente-


mente em matemáticas, pois 12.8 é restrito às propriedades dos inteiros que po-
dem ser expressadas mediante fórmulas da linguagem. O conjunto das fórmulas
é enumerável, enquanto que o conjunto das propriedades dos inteiros positivos
é o conjunto P(N), que não é enumerável.
Queremos provar que a coleção dos inteiros é um conjunto. Isto será provado
a partir do axioma do infinito (de fato, o seguinte teorema é equivalente a [A6]).

Teorema 12.9 Seja Z o sistema composto dos axiomas [A1]-[A6] mais [PR],
isto é, Z é obtido de ZF substituindo o axioma de substituição [A7] pelos a-
xiomas [A2] e [PR]. Logo

Z ` (∃y)(∀z)(z ∈ y ↔ int(z)).

Demonstração: Pelo axioma [A6] existe um conjunto w tal que 0 ∈ w e se


x ∈ w então x + 1 ∈ w. Considere a fórmula ψ(x) dada por x ∈ w. Por indução
matemática obtemos:
(∀x)(int(x) → x ∈ w).
Portanto inferimos que int(x) sse (x ∈ w) ∧ int(x) para todo x. Por otro lado,
de [A2] deduzimos

(∃y)(∀x)(x ∈ y ↔ ((x ∈ w) ∧ int(x))).

Isto significa que existe y = {x : (x ∈ w) ∧ int(x)} = {x : int(x)}. 

Definição 12.10 ω denota {z : int(z)}


(o conjunto dos inteiros não negativos).

Teorema 12.11 (i) Z ` ord(ω).


(ii) Z ` lim(ω).

Demonstração: (i) Considere y ∈ x e x ∈ ω. Logo y ∈ x e int(x); daqui y


é um ordinal (pois y ∈ x e x é um ordinal), e y < x. Logo suc(y). Se z ∈ y,
então z ∈ x, logo suc(z). Daqui int(y), isto é, y ∈ ω. Isto prova que ω é
transitivo. Sejam agora x, y ∈ ω. Logo ord(x) e ord(y). Pela lei de tricotomia
para ordinais obtemos x ∈ y ou y ∈ x ou x = y. Isto prova que ω é conectado
para ∈.
(ii) Observe que ω 6= 0, pois 0 ∈ ω. Além disso ω é um ordinal, por (i).
Claramente
(∀y)(int(y) → int(y + 1)),
isto é, (∀y)(y ∈ ω → (y + 1 ∈ ω)). Pela propriedade [LIM] obtemos que ω é um
ordinal limite. 

53
13 Indução e Recursão Transfinita
Introduziremos a seguir a importante noção de fecho transitivo de um conjunto,
que será utilizada para provar que a relação de pertinência ∈ é bem fundada.
O fato de ∈ ser bem fundada permitirá a introdução de definições e demon-
strações por recursão transfinita em ZF, uma poderosa ferramenta na teoria de
conjuntos.

Definição 13.1 F T (x) denota {y : (∀z)(x ∈ z ∧ transi(z) → y ∈ z)}


(“F T (x) é o fecho transitivo de x”).

Por definição, F T (x) é o menor conjunto transitivo z tal que x ∈ z, isto é, F T (x)
é a interseção de todos os conjuntos transitivos z tais que x ∈ z. Ele é formado
intuitivamente da maneira seguinte: dado x, procuramos nos nı́veis anteriores
os elementos y de x, e recomeçamos o processo, isto é, procuramos os elementos
z de y, e depois os elementos w de z etc., obtendo o “histórico” de x através
destas componentes. É claro que precisamos provar a existência de F T (x)
para todo x. Ela é garantida pelos axiomas da infinidade e da substituição.
Enunciamos este resultado, omitindo a demonstração.

Teorema 13.2 Em ZF o termo F T (x) é legitimado, isto é:

Z ` (∀x)(∃w)(∀y)(y ∈ w ↔ (∀z)(x ∈ z ∧ transi(z) → y ∈ z)).

Podemos agora definir a classe de fórmulas a partir das quais podemos fazer
indução, isto é, as fórmulas ψ(x, y) que expressam relações bem fundadas.

Definição 13.3 Seja φ(x, y) uma fórmula onde x e y ocorrem livres. BF (φ)
denota
(∀x)((x 6= ∅ → (∃v)(v ∈ x ∧ (∀z)(z ∈ x → ¬φ(z, v))))∧
∧(∃u)(x ⊆ u ∧ (∀w, y)(y ∈ u ∧ φ(w, y) → w ∈ u)))
(“a relação φ(x, y) é bem fundada”).

A primeira parte da fórmula anterior afirma que todo conjunto não vazio deve
ter um elemento φ-minimal; intuitivamente, não temos φ-ciclos nem φ-cadeias
descendentes infinitas, isto é: não podemos ter φ(x, x1 ), φ(x1 , x2 ), ..., φ(xn , x)
nem
φ(x1 , x), φ(x2 , x1 ), φ(x3 , x2 ), . . . , φ(xn , xn−1 ), . . . .
A segunda parte afirma que todo conjunto pode ser estendido a um conjunto
u que é φ-fechado, isto é: todo conjunto φ-relacionado com um membro de u
deve pertencer a u.

Proposição 13.4 Em ZF provamos que as relações x < y e x ∈ y são bem


fundadas.

Demonstração: Nas duas relações, a primeira parte é uma conseqüência direta


do axioma da regularidade. A segunda parte segue do Teorema 13.2, tomando
u como sendo F T (x). Com efeito: seja y ∈ x; se x ∈ z e z é transitivo, então
y ∈ z. Logo y ∈ F T (x), donde x ⊆ F T (x). Se y ∈ F T (x) e w ∈ y, considere z

54
transitivo tal que x ∈ z. Logo y ∈ z, donde w ∈ z, pois z é transitivo. Daqui
w ∈ F T (x), portanto F T (x) satisfaz as condições requeridas. 

Podemos agora legitimar a noção de prova por φ-indução transfinita, assumindo


que φ é bem fundada. Assim, para provar que (∀y)ψ(y) basta assumir a ver-
dade de ψ(z) para todos os φ-antecessores z de y. A hipótese de indução é
(∀z)(φ(z, y) → ψ(z)).

Teorema 13.5 (Indução Transfinita) Em S provamos o seguinte:

[BF (φ) ∧ (∀y)((∀z)(φ(z, y) → ψ(z)) → ψ(y))] → (∀y)ψ(y).

Demonstração: Suponha que (∀y)ψ(y) é falsa e BF (φ) é verdadeira. Encon-


traremos v0 tal que

(1) (∀z)(φ(z, v0 ) → ψ(z)) ∧ ¬ψ(v0 ),

contrariando a hipótese do teorema. Seja então v tal que ¬ψ(v); ele existe,
pela suposição ¬(∀y)ψ(y). Como BF (φ), podemos estender {v} a um conjunto
φ-fechado u, isto é:

(2) (v ∈ u) ∧ (z ∈ u ∧ φ(w, z) → w ∈ u).

Considere u0 = {z : (z ∈ u) ∧ ¬ψ(z)}, legitimado por [A2]. Como v ∈ u, então


v ∈ u0 , portanto u0 6= ∅. Pela primeira parte de BF (φ) existe um elemento
v0 de u0 que é φ-minimal. Logo, fixe z tal que φ(z, v0 ); isto implica z 6∈ u0 ,
pois v0 é φ-minimal em u0 , portanto z 6∈ u ou ψ(z). Dado que v0 ∈ u (pois
v0 ∈ u0 ) e φ(z, v0 ), então z ∈ u, por (2). Daqui ψ(z), provando desta maneira:
φ(z, v0 ) → ψ(z) para todo z. Como v0 ∈ u0 , então ¬ψ(v0 ). Desta maneira
provamos (1) como queriamos. 

As provas por indução transfinita são importantes, mas são mais úteis quando
combinadas com a definição por recursão transfinita. Suponha que queremos
definir a soma de ordinais de maneira a ter

α + 0 = α;
(∗) α + (β + S
1) = (α + β) + 1;
α + λ = δ<λ (α + δ) se λ é um ordinal limite.
S
Embora +1 e sejam operações conhecidas, vemos que a segunda e a terceira
cláusula de (∗) utilizam + nos dois lados da definição. Usualmente este tipo de
definição circular seria rejeitada. Porém, devemos observar que os ordinais do
lado direito utilizam + em ordinais menores aos do lado esquerdo (o membro
a ser definido). Podemos pensar que, fixado α, definimos sucessivamente α + β
para ordinais β cada vez maiores, utilizando os valores α + γ com γ < β. O
Teorema da Definição por Recursão Transfinita estabelece que, partindo de uma
relação φ(x, y) bem fundada, então podem ser realizadas este tipo de definições

55
que utilizam os φ-antecessores, e a definição é única. Ou seja, podemos definir
novas operações por indução sobre uma relação bem fundada. Observe que
a definição (∗), embora consista de varias cláusulas, elas podem ser juntadas
numa só cláusula mediante disjunção de conjunções. Assim uma definição pode
ser pensada como sendo introduzida por uma fórmula. Isto coincide com a idéia
→ →
de definição de funções por recursão: se h( x ) e g(x, y; x ) são funções recursi-
vas de números naturais, então podemos definir por recursão sobre x a função
→ →
f (x; x ) (onde x consiste de parâmetros) da maneira seguinte:
→ →
f (0; x ) = h( x );
→ → →
f (x + 1; x ) = g(f (x; x ), x; x ).

Desta maneira f é definida a partir de g, que utiliza o valor anterior de f .


Definiremos um análogo (mais geral) para TC, onde agora g utilizará todos os
valores anteriores de f .
Definição 13.6 Seja G(x1 , ..., xn , y) uma fórmula com ao menos x1 ,..., xn , y
livres. Definimos
G0 hx1 , ..., xn i = {z : (∃y)((∀w)(G(x1 , ..., xn , w) ↔ y = w) ∧ (z ∈ y))}.
Isto é, G0 hx1 , ..., xn i é o único y tal que G(x1 , ..., xn , y) (se existir), ou ∅ em caso
contrário. Logo G0 hx1 , ..., xn i é sempre um conjunto.
Definição 13.7 Seja F (x1 , ..., xn , y) uma fórmula com ao menos x1 , ..., xn , y
livres, e φ(u, v) com u, v livres. Definimos
AN T (F, x1 , ..., xn , φ(u, v)) = {hhz, x2 , x3 , ..., xn i, F 0 hz, x2 , ..., xn ii : φ(z, x1 )}.
O termo AN T (F, x1 , ..., xn , φ(u, v)) define o conjunto dos valores de F prévios
a x1 (a variável de recursão).
Lema 13.8 Se φ(u, v) é bem fundada, então AN T (F, x1 , ..., xn , φ(u, v)) é le-
gitimado em ZF.
Estabeleceremos a seguir o teorema de recursão transfinita. A partir de agora
G(x, x1 , ...., xn , y) é uma fórmula definindo uma operação que é iterada na
variável x1 , com x2 ,..., xn como parâmetros para definir uma operação y =
F 0 hx1 , ...., xn i. Em AN T (F, x1 , ..., xn , φ(u, v)) estão disponı́veis os valores an-
teriores de F , e permanecem no primeiro lugar de G na iteração, da mesma
maneira que é feito na definição da função recursiva
→ → →
f (x + 1; x ) = g(f (x; x ), x; x ).

Teorema 13.9 (Recursão Transfinita) Sejam G(x, x1 , ..., xn , y) e φ(u, v)


fórmulas. Então existe uma fórmula F (x1 , ..., xn , y) tal que

BF (φ(u, v)) → (∀x1 )[(∃!y)F (x1 , ..., xn , y) ∧ (∀y)(F (x1 , ..., xn , y) ↔


↔ y = G0 hAN T (F, x1 , ..., xn , φ(u, v)), x1 , x2 , ..., xn i)]

é demonstrável em ZF.

56
Veremos a seguir dois exemplos de aplicação do princı́pio de definição por re-
cursão transfinita: a função de posto e a hierarquia cumulativa de von Neumann.
S
Definição 13.10 ρ(x) = {ρ(y) + 1 : y ∈ x}
(“ρ(x) é o posto de x”).

Proposição 13.11 Em ZF provamos o seguinte:


(i) ρ(x) é definido para todo conjunto x.
(ii) ρ(x) é um ordinal para todo conjunto x.
(iii) Se α é um ordinal, então ρ(α) = α.
(iv) se x ∈ y, então ρ(x) < ρ(y).

Demonstração: (i) Usaremos o principio de recursão transfinita. Para isto,


considere φ(u, v) como sendo u ∈ v; logo, a relação φ (isto é, a relação ∈) é bem
fundada, pela Proposição 13.4. Seja G(X, x1 , y) a fórmula
[
G(X, x1 , y) ≡def (x1 = x1 ) ∧ (y = {w + 1 : w ∈ im(X)}).

Logo, a operação F (x, y) definida no Teorema 13.9 satisfaz:


[
F 0 hxi = G0 hAN T (F, x, ∈), xi = {w + 1 : w ∈ im(AN T (F, x, ∈))}.

Por outro lado:


AN T (F, x, ∈) = {hz, F 0 hzii : z ∈ x}
donde im(AN T (F, x, ∈)) = {F 0 hzi : z ∈ x}. Daqui
[
F 0 hxi = {F 0 hzi + 1 : z ∈ x}.

Isto significa que a operação F é a função posto.


(ii) Considere a fórmula ψ(x) dada por ord(ρ(x)). Provaremos por indução
transfinita sobre a relação ∈ que ψ(x) é verdadeira para todo x. Assim fixemos
y, e suponhamos que
(∀z)(z ∈ y → ord(ρ(z))
(a hipótese de indução) é verdadeira. Queremos provar que ρ(y) éSum ordinal.
Se z ∈ y, então ord(ρ(z)), logo ord(ρ(z) + 1). Além disso, ρ(y) = {ρ(z) + 1 :
z ∈ y}, logo x ∈ ρ(y) sse existe z ∈ y tal que x ∈ ρ(z) + 1. Sejam então x ∈ ρ(y)
e w ∈ x; logo w ∈ x e x ∈ ρ(z) + 1 para algum z ∈ y, e ρ(z) + 1 é um ordinal
(portanto é transitivo). Daqui w ∈ ρ(z) + 1 e então w ∈ ρ(y). Logo, ρ(y) é
transitivo. Se u, v ∈ ρ(y), então u ∈ ρ(z) + 1 e v ∈ ρ(z 0 ) + 1 para z, z 0 ∈ y.
Dado que ρ(z) + 1 e ρ(z 0 ) + 1 são ordinais, então u e v são ordinais, portanto
u ∈ v ou v ∈ u ou u = v, pela lei de tricotomia para ordinais. Daqui ρ(y) é
conectado, sendo portanto um ordinal.
(iii) Considere ψ(x) a fórmula (ord(x) → x = ρ(x)). Provaremos por indução
transfinita sobre a relação bem fundada < que ψ(x) vale para todo x. As-
sumamos então, fixado y, a hipótese de indução (∀z)(z < y → ψ(z)), isto é,

(∀z)[(ord(z) ∧ ord(y) ∧ z ∈ y) → (ord(z) → z = ρ(z))]

57
ou, equivalentemente,

(∗) (∀z)[(ord(y) ∧ ord(z) ∧ z ∈ y) → z = ρ(z)].

Queremos provar que (ord(y) → y = ρ(y)). Suponha então que y é um ordinal.


Logo, se z ∈ y então z é um ordinal, e vale a hipótese de (∗) para z, portanto
z = ρ(z). Daqui
[ [
ρ(y) = {ρ(z) + 1 : z ∈ y} = {z + 1 : z ∈ y}.

Seja x ∈ ρ(y); logo x ∈ z + 1 para algum z ∈ y. Temos dois casos:


(a) x ∈ z. Logo x ∈ z, z ∈ y implica x ∈ y (pois y é um ordinal portanto é
transitivo).
(b) x = z. Logo x = z, z ∈ y implica x ∈ y.
Vemos que em todos os casos x ∈ ρ(y) implica x ∈ y, donde ρ(y) ⊆ y. Suponha
agora que x ∈ y; logo x ∈ x + 1 tal que x ∈ y, donde x ∈ ρ(y). Isto é, y ⊆ ρ(y),
portanto y = ρ(y) como queriamos provar. S
(iv) Seja x ∈ y. Como ρ(x) ∈ ρ(x) + 1 e x ∈ y, então ρ(x) ∈ {ρ(z) + 1 : z ∈
y} = ρ(y). Dado que ρ(x) e ρ(y) são ordinais, pelo item (ii), então inferimos
que ρ(x) < ρ(y). 

Definição 13.12 A Hierarchia Cumulativa de von Neumann é definida da


maneira seguinte:
[ [
Vα = P(Vβ ) = {P(Vβ ) : β < α}.
β<α

Exemplo 13.13 Aplicando a definição acima temos que


S S
V0 = S{P(Vβ ) : β < 0} = S ∅ = ∅; S S
V1 = S{P(Vβ ) : β < 1} = S{P(V0 )} = {P(∅)} S = {{∅}} = {∅};
V2 = {P(Vβ ) : β < 2} = {P(V0 ), P(V1 )} = {{∅}, {∅, {∅}}}
=S{∅, {∅}}; S
V3 = S{P(Vβ ) : β < 3} = {P(V0 ), P(V1 ), P(V2 )}
= {{∅}, {∅, {∅}}, {∅, {∅}, {{∅}}, {∅, {∅}}}} = {∅, {∅}, {{∅}}, {∅, {∅}}}.


Teorema 13.14 Em ZF provamos o seguinte:


(i) Vα é definido para todos os ordinais α.
(ii) Seja α um ordinal. Logo Vα é transitivo,
S e Vα+1 = P(Vα ).
(iii) Seja λ um ordinal limite. Logo Vλ = β<λ Vβ .
(iv) Seja α um ordinal. Então x ∈ Vα sse ρ(x) < α.
(v) (∀x)(∃α)(x ∈ Vα ) (aqui, α denota um ordinal).

Demonstração: (i) Aplicaremos o principio de recursão transfinita 13.9. Con-


sidere a fórmula
[
G(X, x1 , y) ≡def (x1 = x1 ) ∧ (y = {P(w) : w ∈ im(X)}).

58
A operação F (x, y) definida por recursão transfinita sobre ∈ a partir de G
satisfaz o seguinte:
[
F 0 hxi = {P(w) : w ∈ im(AN T (F, x, ∈))}.

Mas im(AN T (F, x, ∈)) = {F 0 hyi : y ∈ x}, logo


[
F 0 hxi = {P(F 0 hyi) : y ∈ x}.

Se α é um ordinal, então β < α sse β ∈ α, logo F 0 hαi representa Vα sobre os


ordinais α, isto é, Vα está legitimado para todo ordinal α.
(ii) Faremos indução transfinita sobre a relação < e a seguinte fórmula:

ψ(x) ≡def ord(x) → (transi(Vx ) ∧ Vx+1 ⊆ P(Vx )).

Fixado um ordinal y, assuma que a hipótese de indução é verdadeira, isto é,


(∀z)(z < y → ψ(z)) ou, equivalentemente,

(∗) (∀z)(z ∈ y → (transi(Vz ) ∧ Vz+1 ⊆ P(Vz )))

(pois, se y é ordinal, então z < y sse z ∈ y). Queremos provar que Vy é transi-
tivo e Vy+1 ⊆ P(Vy ). Pela definição de Vy temos que

(∗∗) x ∈ Vy sse x ∈ P(Vz ) para algum z ∈ y sse x ⊆ Vz para algum z ∈ y.

Fato 1: Seja u transitivo e w ∈ u. Logo w ⊆ u.


Com efeito, se z ∈ w, então: z ∈ w, w ∈ u, transi(u) implica z ∈ u, isto é:
z ∈ w implica z ∈ u. Daqui w ⊆ u, provando o Fato 1.
Seja então x ∈ Vy e w ∈ x. Por (∗∗) temos que x ⊆ Vz para algum z ∈ y.
Dado que w ∈ x, então w ∈ Vz . Por (∗) temos que Vz é transitivo, e w ∈ Vz ,
logo w ⊆ Vz , pelo Fato 1. Portanto w ∈ Vy , por (∗∗). Isto significa que Vy é
transitivo se y é um ordinal. Falta provar que Vy+1 ⊆ P(Vy ). Por (∗) temos que
Vz+1 ⊆ P(Vz ) para todo z ∈ y, logo Vz+1 = P(Vz ) para todo z ∈ y (a inclusão
P(Vz ) ⊆ Vz+1 é imediata da Definição 13.12). Logo
S S
Vy+1 = S{P(Vz ) : z ∈ y + 1} = ({P(Vz ) : z ∈ y} ∪ {P(Vy )})
= ({Vz+1 : z ∈ y} ∪ {P(Vy )}).

SejaSx ∈ Vy+1 ; logo x ∈ u tal que u ∈ {Vz+1 : z ∈ y} ∪ {P(Vy )}, pela definição
de . Temos dois casos:
(a) u = P(Vy ). Logo, x ∈ P(Vy ).
(b) u = Vz+1 para algum z ∈ y. Provaremos primeiro o seguinte
Fato 2: Se α e β são ordinais, então α < β + 1 implica Vα ⊆ Vβ .
Com efeito, se α < β, então: γ ∈ α implica γ ∈ β. Logo, se w ∈ Vα , então
w ∈ P(Vγ ) para algum γ ∈ α, pela Definição 13.12. Daqui w ∈ P(Vγ ) onde
γ ∈ β, portanto w ∈ Vβ , isto é, Vα ⊆ Vβ . O caso α = β é óbvio. Isto prova o
Fato 2.

59
Continuando com o caso (b), temos que x ∈ u = Vz+1 , onde z ∈ y. Logo existe
w ∈ z + 1 tal que x ∈ P(Vw ), pela Definição 13.12. Mas w ∈ z + 1, z ∈ y implica
w ∈ y, pois y é ordinal. Daqui w < y + 1 e então Vw ⊆ Vy , pelo Fato 2. Dado
que x ∈ P(Vw ), então x ⊆ Vw , donde x ⊆ Vy , isto é, x ∈ P(Vy ).
Vemos que os dois casos (a) e (b) nos levam à conclusão de que x ∈ P(Vy ).
Portanto Vy+1 ⊆ P(Vy ). Desta maneira provamos ψ(y) a partir da hipótese de
indução. Logo, ψ(x) vale para todo x, isto é: Vα é transitivo e Vα+1 = P(Vα ),
se α é um ordinal.
(iii) Seja λ um ordinal limite. Por (ii) temos que
[ [
Vλ = {P(Vβ ) : β < λ} = {Vβ+1 : β < λ}.

Se β < λ então β + 1 < λ, por [LIM], donde Vβ ⊆ Vλ e Vβ+1 ⊆ Vλ , pelo Fato


2. Portanto Vβ ∈ P(Vλ ) e Vβ+1 ∈ P(Vλ ). Isto significa que existem os conjuntos

a = {Vβ : β < λ} = {x : x ∈ P(Vλ ) ∧ (∃β)(β < λ ∧ x = Vβ )},

b = {Vβ+1 : β < λ} = {x : x ∈ P(Vλ ) ∧ (∃β)(β < λ ∧ x = Vβ+1 )}.


S S
Dado que β < λ implica Vβ ⊆ Vλ , então a ⊆ Vλ , pela definição de
S . S Por
S β < λ implica β + 1 < λ então b ⊆ a, donde Vλ = b ⊆ a,
outro lado, como
isto é, Vλ = a como queriamos.
(iv) Considere ψ(x) ≡def (∀α)(x ∈ Vα ↔ ρ(x) < α) (aqui, α é uma variável de
ordinais). Provaremos por indução sobre ∈ que ψ(x) vale para todo x. Seja y,
e suponhamos que

(HI) (∀z)(z ∈ y → ψ(z)).

Queremos provar que vale ψ(y). Fixemos então um ordinal α.


Parte 1: (y ∈ Vα → ρ(y) < α).
Assumamos que y ∈ Vα . Se z ∈ y, então z ∈ Vα , pois Vα é transitivo por (ii).
Por (HI) temos que ρ(z) < α, portanto ρ(z) + 1 ≤ α. Suponha que existe z ∈ y
tal que α = ρ(z) + 1. Logo, por (ii)

y ∈ Vα = Vρ(z)+1 = P(Vρ(z) ).

Daqui y ⊆ Vρ(z) ; mas z ∈ y, logo z ∈ Vρ(z) , e ρ(z) é um ordinal. Por (HI)


obtemos que ρ(z) < ρ(z), uma contradição. Logo ρ(z) + 1 < α para todo z ∈ y.
Portanto [
ρ(y) = {ρ(z) + 1 : z ∈ y} ⊆ α
donde ρ(y) ≤ α. Suponha que α = ρ(y). Dado que y ∈ Vα , então existe β ∈ α
tal que y ∈ P(Vβ ), pela Definição 13.12. Dado que β ∈ α = ρ(y), então existe
z ∈ y tal que β ∈ ρ(z)+1. Mas y ∈ P(Vβ ), então y ⊆ Vβ , e z ∈ y, donde z ∈ Vβ .
Por (HI) temos que ρ(z) < β. Por outro lado provamos que β ∈ ρ(z) + 1, e
então temos dois casos:

(a) β ∈ ρ(z): logo β ∈ ρ(z) e ρ(z) ∈ β, contradição.

60
(b) β = ρ(z): logo ρ(z) ∈ β e β = ρ(z), contradição.

Os dois casos nos levam a uma contradição, portanto ρ(y) < α. Isto conclui a
prova da Parte 1.
Parte 2: (ρ(y) < α → y ∈ Vα ).
Assumamos que [
ρ(y) = {ρ(z) + 1 : z ∈ y} < α.
S S
Suponha que y 6∈ Vα = {P(Vβ ) : β < α}. Aplicando a definição de
obtemos:

(∗ ∗ ∗) para todo β < α existe z ∈ y tal que z 6∈ Vβ

pois y 6∈ P(Vβ ) sse y 6⊆ Vβ . Por hipótese ρ(y) < α donde, por (∗∗∗), existe z ∈ y
tal que z 6∈ Vρ(y) . Dado que z ∈ y e ρ(z) < ρ(z) + 1 então, por (HI), temos que
z ∈ Vρ(z)+1 . Mas z ∈ y implica ρ(z) < ρ(y), pela Proposição 13.11(iv). Logo
ρ(z)+1 < ρ(y)+1, donde Vρ(z)+1 ⊆ Vρ(y) , pelo Fato 2. De z ∈ Vρ(z)+1 obtemos
z ∈ Vρ(y) , uma contradição. Portanto y ∈ Vα . Provamos desta maneira a Parte
2, obtendo portanto ψ(y). Por indução transfinita temos que ψ(x) vale para
todo x.
(v) Dado x, então ρ(x) é um ordinal, portanto ρ(x) + 1 é também um ordinal,
e ρ(x) < ρ(x) + 1. Pelo item (iv) inferimos que x ∈ Vρ(x)+1 . 

O teorema anterior é a afirmação mais forte que podemos fazer em ZF com


relação à teoria cumulativa de tipos. Provamos desta maneira que os objetos
que estudamos na linguagem (reprsentados pelas variáveis livres) pertencem de
fato a uma estrutura cumulativa. O ordinal ρ(x)+1 indica o nı́vel da hierarquia
em que o conjunto x aparece pela primeira vez; portanto o seu posto ρ(x) de-
nota exatamente o nı́vel em que ele é concebido. Por outro lado, Vα é a coleção
de todos os conjuntos que apareceram antes do nı́vel α. Logo Vα+1 −Vα consiste
dos conjuntos criados no nı́vel α. O fato que ρ(x) + 1 = M in{β : x ∈ Vβ } é
fácil de ser provado. Com efeito:

(a) ρ(x) < ρ(x) + 1 implica x ∈ Vρ(x)+1 ;


(b) x ∈ Vβ implica ρ(x) < β implica ρ(x) + 1 ≤ β.

Assim, 0 aparece no nı́vel 1 (pois o nı́vel 0 é vazio); 1 é concebido no nı́vel 1 (isto


é, ρ(1) = 1 ' 1), logo só aparece no nı́vel 2; em geral, n é concebido no nı́vel
ρ(n) = n ' n, portanto aparece pela primeira vez no nı́vel seguinte n + 1. Já
ω aparece no nı́vel ω + 1, pois ele é criado no nı́vel ω (“infinito”), enquanto que
Vω consiste de todos os conjuntos que apareceram em nı́veis finitos. Em geral,
se α é um ordinal, então α é concebido no nı́vel α, logo aparece no nı́vel α + 1,
isto é: α ∈ Vα+1 − Vα . Cada nı́vel (diferente do nı́vel 0) contém exatamente
um ordinal, e cada ordinal denota um nı́vel. Neste sentido forte, os ordinais
descrevem os nı́veis da hierarquia cumulativa de tipos.

61
14 Aritmética Ordinal
Continuaremos estudando nesta seção os ordinais. Primeiro de tudo provaremos
que os ordinais são exatamente os conjuntos bem ordenados, dai a denominação
de ordinais. Lembremos da Definição 6.10 que bo(r, x) denota que r é uma boa
ordem em x, e min(v, r, u) denota v ∈ u ∧ (∀w)(w ∈ u → ¬(w r v)) (v é um
elemento r-minimal de u). Introduzimos a seguinte notação:
Definição 14.1 bf (r, x) denota (∀u)(u ⊆ x ∧ u 6= ∅ → (∃v)min(v, r, u)
(“r é bem fundada sobre x”)
Usando esta definição, é imediato que bo(r, x) ↔ bf (r, x) ∧ con(r, x), em que
con(r, x) denota que r é conectada em x (lembre da Definição 6.1). Como foi
provado nas Proposições 6.12 e 6.13, uma boa ordem r em x equivale a uma
ordem estrita r em x tal que todo subconjunto de x não vazio tem r-primeiro
elemento.
Lema 14.2 Seja E(x) = {hy, zi : y, z ∈ x ∧ y ∈ z}. Em S vale o seguinte:
(i) Se x é um ordinal, então E(x) é uma boa ordem em x.
(ii) Se r é bem fundada em z, então φ(x, y) ≡def (x, y ∈ z) ∧ (x r y) é bem
fundada (lembre da Definição 13.3).
Demonstração: (i) Se x é um ordinal, então y E(x) z sse y < z para todo
y, z ∈ x. Dado que y < z é uma relação bem fundada, então E(x) é bem
fundada em x. Se y, z ∈ x então y e x são ordinais. Pela lei de tricotomia para
ordinais temos que E(x) é conectada em x.
(ii) Seja r bem fundada em z, e considere φ(x, y) ≡def (x, y ∈ z) ∧ (x r y). Se
x 6= ∅, queremos provar o seguinte:

(∗) (∃ v ∈ x)(∀ w ∈ x)(w ∈ z ∧ v ∈ z → ¬(w r v),

pois ¬φ(w, v) ↔ [w ∈ z ∧ v ∈ z → ¬(w r v)]. Considere u = x ∩ z ⊆ z. Se u = ∅,


então tomando v ∈ x arbitrário (estamos assumindo que x é não vazio) obtemos
(∗) trivialmente, pois v 6∈ z. Se u 6= ∅ então, dado que u ⊆ z, temos que existe
v ∈ u (portanto v ∈ x) tal que ¬(w r v) para todo w ∈ u, pois r é bem fundada
em z. Seja w ∈ x; se w ∈ z e v ∈ z, isto é, se w ∈ z, então inferimos w ∈ u,
donde ¬(w r v). Isto prova (∗), e logo φ(x, y) satisfaz a primeira metade da
definição de relação bem fundada. Para a segunda metade, seja x arbitrário;
queremos provar que existe u tal que

(∗∗) x ⊆ u ∧ (∀ w, y)(y ∈ u ∧ φ(w, y) → w ∈ u).

Se x = ∅, então u = ∅ satisfaz trivialmente (∗∗). Se x 6= ∅ considere

u = x ∪ {w : w ∈ z ∧ (∃ y ∈ z)(w r y)}.

Temos que u 6= ∅ e x ⊆ u. Sejam w e y tais que y ∈ u e φ(w, y), logo: y, w ∈ z


e w r y. Daqui w ∈ u, pela definição de u, portanto vale (∗∗) e então φ(x, y) é
bem fundada. 

62
Lema 14.3 Em ZF provamos o seguinte: se bf (r, z), então existe

h(x) = {h(y) : y ∈ z ∧ y r x}

para todo x ∈ z.

Demonstração: Usaremos recursão transfinita para definir os conjuntos h(x).


Considere a fórmula

G(X, x1 , y) ≡def (x1 = x1 ) ∧ (y = im(X)).

Seja F (x, y) a operação definida a partir de G(X, x1 , y) por recursão transfinita


na relação bem fundada φ(x, y) ≡def (x, y ∈ z) ∧ (x r y) (temos que φ(x, y) é
bem fundada pelo Lema 14.2(ii)). Por definição

AN T (F, x, φ(u, v)) = {hy, F 0 hyii : φ(y, x)}

portanto, fixado x ∈ z,

F 0 hxi = G0 hAN T (F, x, φ(u, v)), xi


= im(AN T (F, x, φ(u, v))
= {F 0 hyi : φ(y, x)}
= {F 0 hyi : x, y ∈ z ∧ y r x}
= {F 0 hyi : y ∈ z ∧ y r x}.

Desta maneira, F (x, y) representa a operação h(x) desejada para todo x ∈ z. 

Teorema 14.4 (Caracterização dos Ordinais) Em ZF prova-se: se r é uma


boa ordem em z, então existe um ordinal α tal que

h : z−→ α, h(x) = {h(y) : y ∈ z ∧ y r x}

é um isomorfismo de conjuntos bem ordenados, isto é: h é uma bijeção tal que:
x r y sse h(x) < h(y). O ordinal α e o isomorfismo h são únicos.

Demonstração: Seja r uma boa ordem em z; logo, bf (r, z) donde existe h(x)
para todo x ∈ z, pelo Lema 14.3. Seja

r∗ = (r|z) ∪ {hy, zi : y ∈ z}

lembrando que r|z = {hx, yi : x ∈ z ∧ x r y}. Provaremos que r∗ é bem


fundada em z + 1. Seja então u ⊆ z + 1, u 6= ∅.
Caso 1: u ⊆ z. Como bf (r, z), existe v ∈ u tal que ¬(w r v) para todo w ∈ u.
Pela construção de r∗ , temos que ¬(w r∗ v) para todo w ∈ u pois r coincide
com r∗ em z × z.
Caso 2: u = {z} ∪ u1 tal que u1 ⊆ z. Se u1 = ∅ então v = z satisfaz: v ∈ u
e ¬(w r∗ v) para todo w ∈ u. Se u1 6= ∅ então u1 ⊆ z é não vazio, logo existe
v ∈ u1 tal que ¬(w r v) para todo w ∈ u1 . Como ¬(z r∗ v), pela construção de

63
r∗ , então ¬(w r∗ v) para todo w ∈ u.
Isto prova que bf (r∗ , z + 1). Pelo Lema 14.3 inferimos que existe

h∗ (x) = {h∗ (y) : (y ∈ z + 1) ∧ (y r∗ x)}

para todo x ∈ z + 1.
Fato 1: h∗ (x) = h(x) para todo x ∈ z.
Com efeito: seja ψ(x) ≡def (x ∈ z → h∗ (x) = h(x)). Fixemos y tal que

(HI) (∀w)(φ(w, y) → ψ(w)),

onde φ(u, v) ≡def (u, v ∈ z)∧(u r v) é uma relação bem fundada, pelo Lema 14.2(ii).
Suponhamos que y ∈ z; logo, pela construção de r∗ :

h∗ (y) = {h∗ (w) : (w ∈ z + 1) ∧ (w r∗ y)}


= {h∗ (w) : w ∈ z ∧ w r y}
= {h∗ (w) : φ(w, y)}.

Por (HI) temos que ψ(w) para todo w tal que φ(w, y). Como φ(w, y) implica w ∈
z, então obtemos que h∗ (w) = h(w) para todo w tal que φ(w, y). Daqui h∗ (y) =
h(y). Por indução transfinita sobre φ(x, y) inferimos que ψ(x) é verdadeira para
todo x como queriamos, provando o Fato 1.
A partir do Fato 1 e da definição de r∗ obtemos

h∗ (z) = {h∗ (y) : (y ∈ z + 1) ∧ (y r∗ z)} = {h∗ (y) : y ∈ z} = {h(y) : y ∈ z}.

Seja α ≡def h∗ (z). Provaremos que α é um ordinal. Seja x ∈ h(y), y ∈ z. Logo


x = h(w) tal que w ∈ z, pelas definições de h(y) e φ(w, y), portanto x ∈ α;
daqui α é transitivo. Sejam h(x), h(y) ∈ α. Como x, y ∈ z, então y = x ou
y r x ou x r y. Se x = y então h(x) = h(y). O caso em que y r x implica
h(y) ∈ h(x). Se x r y então h(x) ∈ h(y). Vemos assim que α é conectado. Daqui
obtemos que α é um ordinal, portanto h(x) é um ordinal para todo x ∈ z, e α
é bem ordenado pela relação E(α) = <, pelo Lema 14.2(i). A propriedade x r
y sse h(x) < h(y) é imediata, logo h : z−→ α é um isomorfismo de conjuntos
bem ordenados. Para provar a unicidade de α, suponha que hz, ri é isomorfo
a hβ, <i via g : z−→ β para um outro ordinal β. Logo g ◦ h−1 : α−→ β é um
isomorfismo.
Fato 2: Sejam α e β ordinais, e f : α−→ β un isomorfismo, isto é: f é uma
bijeção tal que γ < δ sse f (γ) < f (δ) para todo γ, δ ∈ α. Logo f (γ) = {f (δ) :
δ < γ}, donde f (γ) = γ para todo γ ∈ α.
Com efeito, se δ < γ < α, então f (δ) ∈ f (γ). Por outro lado, seja θ ∈ f (γ);
então θ = f (δ) para δ ∈ α, pois f é sobrejetora. Daqui f (δ) < f (γ) implica δ <
γ, e então θ = f (δ) com δ < γ, isto é: f (γ) = {f (δ) : δ < γ}. Considerando a
fórmula
ψ(x) ≡def x ∈ α → f (x) = x
então é agora muito simples provar por indução sobre ∈ que ψ(x) vale para
todo x (exercı́cio!), concluindo a prova do Fato 2.

64
Temos que g ◦ h−1 : α−→ β é um isomorfismo. Pelo Fato 2, g ◦ h−1 (x) = x
para todo x ∈ α. Mas g ◦ h−1 é sobrejetora, portanto α = β, e g ◦ h−1 = I(α).
Daqui g = h (compondo à direita com h). Isto mostra que α e h são unicos
para cada hz, ri. 

Pelo Lema 14.2(i) vemos que todo ordinal α é bem ordenado pela relação <.
Reciprocamente, pelo Teorema 14.4, se z é um conjunto bem ordenado por uma
relação r então existe um único ordinal α e um único isomorphismo h : z−→ α
de conjuntos bem ordenados tal que hz, ri ' hα, <i. O ordinal α associado com
hz, ri é dito o tipo ordinal de hz, ri. Observe que o tipo ordinal α de z depende
da relação r: com efeito, z pode possuir duas estruturas de boa ordem r1 e r2
não isomorfas, de maneira a ter associados dois tipos ordinais, α1 para hz, r1 i e
α2 para hz, r2 i com α1 6= α2 .

Exemplo 14.5 Considere em N a estrutura usual r1 de boa ordem: n r1 m


sse n < m. Logo, h1 : N−→ ω dada por h1 (n) = n é o único isomorfismo de
hN, r1 i em hω, <i tal que ω é o tipo ordinal de hN, r1 i. Por outro lado, considere
a seguinte relação r2 em N:

n r2 m se n, m > 0 e n < m;
n r2 0 para todo n > 0.

Isto é: r2 coincide com a boa ordem usual < para todos os números naturais
positivos, e 0 é colocado como r2 -último elemento de N. É muito simples ver
que r2 é uma boa ordem em N (conferir!). Considere h2 : N−→ ω + 1 dada por

n − 1 se n > 0
h2 (n) = .
ω se n = 0
Temos que h2 é um isomorfismo entre hN, r2 i e hω + 1, <i (conferir!), portanto
ω + 1 é o tipo ordinal de hN, r2 i, sendo que ω 6= ω + 1. Isto mostra que o tipo
ordinal de um conjunto bem ordenado depende da boa ordem especificada. 

Definição 14.6 Sejam α e β ordinais. Definimos a soma ordinal α + β como


sendo

 α


se β = 0


α+β = (α + γ) + 1 se β = γ + 1 .


 S

γ<β (α + γ) se β é limite ordinal

Para provar que a soma está bem definida, precisamos introduzir uma relação
bem fundada apropriada.

Lema 14.7 Considere a fórmula

φ(u, v) ≡def (ord(u) ∧ ord(v)) ∧ [(∃z)(v = z + 1 ∧ u = z) ∨ (lim(v) ∧ u ∈ v)].

65
Então φ(u, v) é uma relação bem fundada.

Demonstração: Seja x 6= ∅. Pelo axioma da regularidade, existe v ∈ x tal


que (∀ z ∈ x)(z 6∈ v). Logo, v 6= z + 1 para todo z ∈ x, e então não vale
(∃z)(v = z + 1 ∧ u = z) para todo u ∈ x. Se v é um ordinal limite então, dado
que z 6∈ v para todo z ∈ x, inferimos que não vale (lim(v) ∧ u ∈ v) para todo
u ∈ x. Desta maneira obtemos: u ∈ x → ¬φ(u, v), donde

x 6= ∅ → (∃ v ∈ x)(∀ w ∈ x)¬φ(w, v).

Para provar a segunda parte da Definição 13.3 de relação bem fundada, seja
x arbitrário, e considere u = F T (x), o fecho transitivo de x. Seja y ∈ u e w
tal que φ(w, y). Se z é um conjunto transitivo tal que x ∈ z então y ∈ z, pois
y ∈ F T (x). Dado que φ(w, y), então w ∈ y (é uma conseqüência direta da
definição de φ), logo w ∈ z (pois z é transitivo). Daqui w ∈ F T (x) = u, donde

(∃u)(x ⊆ u ∧ (∀ w, y)(y ∈ u ∧ φ(w, y) → w ∈ u)).

Isto prova que φ(u, v) é uma relação bem fundada. 

LemaS14.8 Seja b um conjunto de ordinais, isto é: (∀x)(x ∈ b → ord(x)).


Logo b é um ordinal.
S
Demonstração: Seja a = b. Considere x ∈ a e y ∈ x. Logo, existe z ∈ b
tal que x ∈ z. Por hipótese z é um ordinal, e y ∈ x, x ∈ z; portanto y ∈ z
com z ∈ b, donde y ∈ a. Isto mostra que a é transitivo. Por outro lado, sejam
x, y ∈ a; logo existem z, w ∈ b tais que x ∈ z e y ∈ w. Por hipótese z e w são
ordinais, logo x e y são ordinais. Portanto x = y ou x ∈ y ou y ∈ x pela lei
de tricotomia para ordinais. Isto prova que a é conectado para ∈, portanto a é
um ordinal. 

Proposição 14.9 A soma ordinal está bem definida em ZF, isto é, para cada
ordinal α e β, existe um único conjunto α + β definido de acordo com a Defi-
nição 14.6.

Demonstração: Para provar que a soma ordinal está bem definida usaremos
recursão transfinita sobre a relação bem fundada φ(u, v) do Lema 14.7. Con-
sidere a seguinte fórmula:
S
G(X, x1 , x2 , y) ≡def [x1 = 0∧y = x2 ]∨ S
[(∃z)(x1 = z+1)∧y = ( im(X))+1]
∨ [lim(x1 ) ∧ y = im(X)].

Logo, definimos por recursão transfinita sobre φ(u, v) uma operação F (x1 , x2 , y).
Temos que, se x1 é um ordinal, então

AN T (F, 0, x2 , φ(u, v)) = {hhw, x2 i, F 0 hw, x2 ii : φ(w, 0)} = ∅,

AN T (F, z + 1, x2 , φ(u, v)) = {hhw, x2 i, F 0 hw, x2 ii : φ(w, z + 1)}

66
= {hhz, x2 i, F 0 hz, x2 ii},

AN T (F, x1 , x2 , φ(u, v)) = {hhw, x2 i, F 0 hw, x2 ii : φ(w, x1 )}


= {hhw, x2 i, F 0 hw, x2 ii : w ∈ x1 }

segundo o caso: x1 = 0, x1 = z + 1 ou x1 é um ordinal limite, respectivamente.


Obtemos assim em cada caso:

im(AN T (F, 0, x2 , φ(u, v))) = ∅,

im(AN T (F, z + 1, x2 , φ(u, v))) = {F 0 hz, x2 i},

im(AN T (F, x1 , x2 , φ(u, v))) = {F 0 hw, x2 i : w ∈ x1 },

respectivamente. Portanto, se α e β são ordinais, então

F 0 h0, αi = G0 hAN T (F, 0, α, φ(u, v)), 0, αi = α,

F 0 hγ + 1, αi = G0 hAN T (F, γ + 1, α, φ(u, v)), γ + 1, αi = ( {F 0 hγ, αi}) + 1


S
= (F 0 hγ, αi) + 1,

F 0 hβ, αi = G0 hAN T (F, β, α, φ(u, v)), β, αi = {F 0 hγ, αi : γ ∈ β}


S

segundo o caso: β = 0, β = γ + 1 ou β é um ordinal limite, respectivamente.


Desta maneira F 0 hβ, αi = α + β é definido de acordo com 14.6; isto é, sempre
podemos definir o conjunto α + β. 

Proposição 14.10 Sejam α e β ordinais. Então α + β é um ordinal.

Demonstração: Considere a fórmula

ψ(x) ≡def ord(x) → (∀z)(ord(z) → ord(z + x)).

Provaremos por indução sobre φ(u, v) (Lema 14.7) que ψ(x) vale para todo x;
logo teremos que α + β é um ordinal para todo ordinal α e β. Seja y um con-
junto satisfazendo

(HI) (∀w)(φ(w, y) → ψ(w)).

Queremos provar que vale ψ(y). Suponhamos então que y é um ordinal, e seja
z um ordinal. Provaremos que z + y é um ordinal. Temos três casos:
(a) y = 0. Logo z + y = z, portanto z + y é um ordinal.
(b) y = w + 1. Logo temos que φ(w, y), portanto vale ψ(w), por (HI). Como y
é um ordinal e w ∈ y, então w é um ordinal, logo ord(z) → ord(z + w). Mas z é
um ordinal, portanto z +w é um ordinal. Daqui inferimos que z +y = (z +w)+1
é um ordinal.

67
(c) y é um ordinal limite. Se w ∈ y então vale φ(w, y), donde vale ψ(w) por
(HI). Dado que w ∈ y implica que w é um ordinal, então, como antes, obtemos
que z + w é um ordinal para todo w ∈ y. Pelo Lema 14.8 deduzimos que
[
z + y = {z + w : w ∈ y}

é um ordinal.
Portanto, em todos os casos possı́veis temos que z + y é um ordinal, provando
que (HI) implica ord(y) → (∀z)(ord(z) → ord(z + y)), isto é, ψ(y). Por indução
transfinita inferimos que ψ(x) vale para todo x. 

Proposição 14.11 Sejam α, β e γ ordinais. Então β < γ implica que α + β <


α + γ.

Demonstração: Considere a fórmula

ψ(x) ≡def ord(x) → (∀y)(y < x → (∀z)(ord(z) → (z + y < z + x))).

Por indução sobre a fórmula φ(u, v) do Lema 14.7 provaremos que ψ(x) vale
para todo x. Suponha que temos

(HI) (∀w)(φ(w, x) → ψ(w)).

Queremos provar ψ(x). Suponha que x é um ordinal.


(1) Se x = 0 então y < x é falso para todo y, portanto

(∀y)(y < x → (∀z)(ord(z) → (z + y < z + x)))

é trivialmente verdadeiro.
(2) Se x = w + 1, considere y < x e z um ordinal.
(2.1) Se y = w então z + w < (z + w) + 1 = z + (w + 1) = z + x.
(2.2) Se y ∈ w então, dado que φ(w, x), obtemos ψ(w) por (HI), portanto
z + y < z + w (pois y < w). Mas z + w < z + x (caso 2.1), logo z + y < z + x.
(3) Se x é um ordinal limite, seja y < x e z um ordinal.S Como (z +y) ∈ (z +(y +
1)) (caso 2.1) e y+1 ∈ x, pois x é limite, então z+y ∈ {z+w : w ∈ x} = z+x.
Em todos os casos temos que (∀y)(y < x → (∀z)(ord(z) → (z + y < z + x))) é
verdadeiro. Portanto (HI) implica ψ(x) donde ψ(x) vale para todo x. 

Proposição 14.12 α + (β + γ) = (α + β) + γ para todo ordinal α, β e γ.

Demonstração: Considere a fórmula

ψ(z) ≡def ord(z) → (∀ x, y)(ord(x) ∧ ord(y) → ((x + y) + z = x + (y + z))).

Por indução na relação φ(u, v) do Lema 14.7 provaremos que ψ(x) vale para
todo x. Seja z tal que

(HI) (∀w)(φ(w, z) → ψ(w)).

68
Suponha que z é ordinal, e sejam x, y ordinais.
(1) Se z = 0, então (x + y) + z = x + y = x + (y + 0) = x + (y + z).
(2) Se z = w + 1, então temos φ(w, z), donde vale ψ(w) por (HI). Daqui

(x + y) + z = (x + y) + (w + 1) = ((x + y) + w) + 1
=HI (x + (y + w)) + 1 = x + ((y + w) + 1)
= x + (y + (w + 1)) = x + (y + z).

(3) Se z é limite, então provaremos primeiro os seguintes


Fatos: Seja γ ordinal limite.
(a) Se x ∈ α + θ tal que θ ∈ β + γ então existe δ < γ tal que x ∈ α + (β + δ).
(b) β + γ é um ordinal limite.
Com efeito, seja x ∈ α + θ tal que θ ∈ β + γ. Logo θ ∈ β + δ tal que δ ∈ γ.
De θ < β + δ inferimos que α + θ < α + (β + δ), pela Proposição 14.11. Logo
x ∈ α + (β + δ)Spara algum δ ∈ γ, provando o item (a). Para provar (b), observe
que β + γ = {β + δ : δ ∈ γ} é não vazio. Seja u ∈ β + γ, logo u ∈ β + δ
para algum δ ∈ γ. Daqui u + 1 ∈ (β + δ) + 1 = β + (δ + 1), onde δ + 1 ∈ γ.
Assim u + 1 ∈ β + γ, donde β + γ é um ordinal limite, por [LIM]. Isto conclui
a demonstração dos Fatos.
Por causa dos Fatos(b) obtemos que y +z é um ordinal limite, e pelos Fatos(a)
[ [
x + (y + z) = {x + w : w ∈ y + z} ⊆ {x + (y + w) : w ∈ z}.

Além disso, se w ∈ z então (y + w) ∈ (y + z) pela Proposição 14.11, logo:

u ∈ x + (y + w) para w ∈ z implica u ∈ x + w0 com w0 ∈ y + z


S
implica u ∈ {x + w : w ∈ y + z},

donde [ [
{x + (y + w) : w ∈ z} ⊆ {x + w : w ∈ y + z}
e assim
[ [
x + (y + z) = {x + w : w ∈ y + z} = {x + (y + w) : w ∈ z}.

Mas, para todo w ∈ z temos que φ(w, z) é satisfeita, logo vale ψ(w) por (HI),
donde x + (y + w) = (x + y) + w para todo w ∈ z. Portanto
[ [
x + (y + z) = {x + (y + w) : w ∈ z} = {(x + y) + w : w ∈ z} = (x + y) + z.

Acabamos de provar que (HI) implica ψ(z). Por indução transfinita obtemos
que ψ(z) vale para todo z. 
S
Lema 14.13 Seja α um ordinal limite. Então α = α.
Demonstração:
S Seja x ∈ α; logo, x+1 ∈ S
α. Portanto x ∈ x+1 com x+1 S ∈ α,
donde x ∈ α. Daqui obtemos que α ⊆ α. Reciprocamente, seja x ∈ α;
S x ∈ y para algum y ∈ α; dado que αSé transitivo, então x ∈ α. Portanto
logo
α ⊆ α. Desta maneira, temos que α = α. 

69
Proposição 14.14 Seja α um ordinal. Vale o seguinte:
(i) 0 + α = α.
(ii) α + 1 = α + 1.

Demonstração: (i) Por indução na relação φ(u, v) do Lema 14.7, provaremos


que (∀x)ψ(x), onde
ψ(x) ≡def ord(x) → (0 + x = x).
Seja x um conjunto satisfazendo

(HI) (∀z)(φ(z, x) → ψ(z)).

Assuma que x é um ordinal. Temos três casos para analizar:


(a) x = 0. Logo 0 + x = 0 + 0 = 0 = x.
(b) x = z + 1. Logo φ(z, x) e ord(z), portanto 0 + z = z, por (HI). Daqui
0 + x = 0 + (z + 1) = (0 + z) + 1 = z + 1 = x.
(c) x é um ordinal limite. Se z ∈ x, então φ(z, x) e ord(z), portanto 0 + z = z,
por (HI). Daqui
[ [ [
0 + x = {0 + z : z ∈ x} = {z : z ∈ x} = x=x

pelo Lema 14.13. Vemos que nos três casos possı́veis 0 + x = x. Portanto (HI)
implica ψ(x) donde, por indução transfinita, obtemos que ψ(x) é verdadeira
para todo x.
(ii) Temos que 1 = 0 + 1, pela definição de 1. Logo
α + 1 = α + (0 + 1) = (α + 0) + 1 = α + 1.


Definiremos agora o produto de ordinais.


Definição 14.15 Sejam α e β ordinais. Definimos o produto ordinal α·β como
sendo

α · 0 = 0;
α · (β +S1) = (α · β) + α;
α · β = γ<β α · γ se β é ordinal limite.

Como foi feito com a soma ordinal, podemos provar que α · β pode ser definido,
e α · β é um ordinal. A relação funcional G(X, x1 , x2 , y) utilizada para definir
F (x1 , x2 , y) tal que F 0 hβ, αi = α · β é dada neste caso por
S
G(X, x1 , x2 , y) ≡def [x1 = 0∧y = 0]∨[(∃z)(x
S 1 = z+1)∧y = ( im(X))+x2 ]
∨ [lim(x1 ) ∧ y = im(X)]

(confira os detalhes!).

70
Proposição 14.16 Seja α um ordinal. Logo 0 · α = 0.
Demonstração: Por indução na relação φ(u, v) do Lema 14.7, provaremos que
(∀x)ψ(x), onde
ψ(x) ≡def ord(x) → (0 · x = 0).
Seja x um conjunto satisfazendo

(HI) (∀z)(φ(z, x) → ψ(z)).

Assuma que x é um ordinal. Temos três casos para analizar:


(a) x = 0. Logo 0 · x = 0 · 0 = 0.
(b) x = z + 1. Logo φ(z, x) e ord(z), portanto 0 · z = 0, por (HI). Daqui
0 · x = 0 · (z + 1) = (0 · z) + 0 = 0 + 0 = 0.
(c) x é um ordinal limite. Se z ∈ x, então φ(z, x) e ord(z), portanto 0 · z = 0,
por (HI). Daqui
[ [ [
0 · x = {0 · z : z ∈ x} = {0 : z ∈ x} = {0} = 0.

Vemos que nos três casos possı́veis 0 · x = 0. Portanto (HI) implica ψ(x) donde,
por indução transfinita, obtemos que ψ(x) é verdadeira para todo x. 

Proposição 14.17 Seja α um ordinal. Então α · 1 = α = 1 · α.

Demonstração: Por indução na relação φ(u, v) do Lema 14.7, provaremos que


(∀x)ψ(x), onde
ψ(x) ≡def ord(x) → (1 · x = x).
Seja x um conjunto satisfazendo

(HI) (∀z)(φ(z, x) → ψ(z)).

Assuma que x é um ordinal. Temos três casos para analizar:


(a) x = 0. Logo 1 · x = 1 · 0 = 0 = x.
(b) x = z + 1. Logo φ(z, x) e ord(z), portanto 1 · z = z, por (HI). Daqui
1 · x = 1 · (z + 1) = (1 · z) + 1 = z + 1 = z + 1 = x.
(c) x é um ordinal limite. Se z ∈ x, então φ(z, x) e ord(z), portanto 1 · z = z,
por (HI). Daqui
[ [ [
1 · x = {1 · z : z ∈ x} = {z : z ∈ x} = z=z

pelo Lema 14.13. Daqui 1 · x = x em todos os casos. Assim (HI) implica


ψ(x) donde, por indução transfinita, inferimos que (∀x)ψ(x). A segunda parte
é provada diretamente:
x · 1 = x · (0 + 1) = (x · 0) + x = 0 + x = x
pelo Lema 14.14(i). 

71
Proposição 14.18 Se α > 0 e β é ordinal limite, então α · β é um ordinal
limite.

Demonstração: Por definição temos que


[
α · β = {α · γ : γ ∈ β},

portanto α · β 6= 0. Seja x ∈ α · β; logo x ∈ α · γ para algum γ ∈ β, donde


x + 1 ∈ (α · γ) + 1. Dado que α < 1 sse α = 0 então, pela lei de tricotomia dos
ordinais, temos dois casos para serem analizados:
(a) α = 1. Logo

(α · γ) + 1 = (α · γ) + 1 = (α · γ) + α = α · (γ + 1).

Mas γ + 1 ∈ β, pois γ ∈ β e β é ordinal limite. Daqui x + 1 ∈ α · β.


(b) 1 < α. Pelo Lema 14.14(ii) e a Proposição 14.11 inferimos:

(α · γ) + 1 = (α · γ) + 1 < (α · γ) + α = α · (γ + 1).

Daqui x + 1 ∈ α · (γ + 1) onde γ + 1 ∈ β, pois γ ∈ β e β é um ordinal limite.


Portanto x + 1 ∈ α · β. Nos dois casos possı́veis para α obtemos: x ∈ α · β
implica x + 1 ∈ α · β. Isto prova que α · β é um ordinal limite, pela propriedade
[LIM] (introduzida logo após a Definição 12.7). 

Por indução transfinita pode ser provado o seguinte:


Proposição 14.19 Sejam α, β e γ ordinais. Em ZF vale o seguinte:
(a) α · (β + γ) = (α · β) + (α · γ).
(b) α · (β · γ) = (α · β) · γ.
Definiremos agora a exponenciação ordinal.
Definição 14.20 Sejam α e β ordinais. A exponenciação ordinal αβ é definida
da maneira seguinte:

α0 = 1;
αβ+1 = αβ · α;
αβ = γ∈β αγ se β é ordinal limite e 0 < α;
S

αβ = 0 se β é ordinal limite e α = 0.

Podemos provar como antes que a definição acima é legitimada em ZF por re-
cursão transfinita em φ(u, v) (Lema 14.7) utilizando
S
G(X, x1 , x2 , y) ≡def [x1 = 0∧y = 1]∨[(∃z)(x1 =Sz +1)∧y = ( im(X))·x2 ]
∨ [lim(x1 ) ∧ x2 6= 0 ∧ y = im(X)]
∨ [lim(x1 ) ∧ x2 = 0 ∧ y = 0]

para definir uma operação F (x1 , x2 , y) tal que F 0 hβ, αi = αβ (confira os deta-
lhes!). Por indução transfinita pode ser provado o seguinte:

72
Proposição 14.21 Sejam α, β e γ ordinais. Em ZF valem as seguintes pro-
priedades:
(a) αβ é um ordinal.
(b) α1 = α.
(c) Se β > 0 então 0β = 0.
(d) 1α = 1.
(e) αβ+γ = αβ · αγ .
(f ) (αβ )γ = αβ·γ .

Observação 14.22 Se bem as operações de soma, produto e exponenciação


ordinal possuem propriedades análogas às propriedades das mesmas operações
numéricas, existem algumas diferências notórias. Certas asimetrias (não comu-
tatividade da soma e o produto, por exemplo) aparecem por causa das próprias
definições, feitas por recursão transfinita numa só das variáveis. Podemos
destacar os seguintes exemplos em que as operações são “mal comportadas”:

1 + ω = ω 6= ω + 1; logo a soma ordinal não é comutativa.

2 · ω = ω 6= ω · 2, logo o produto ordinal não é comutativo.

(1 + 1) · ω = 2 · ω = ω 6= (1 · ω) + (1 · ω);

logo o produto ordinal não é distributivo à direita da soma ordinal. 

15 Cardinais
Finalmente estudaremos a noção de número cardinal. Os cardinais foram in-
troduzidos originalmente por Frege e Russell para indicar o “tamanho” dos
conjuntos. A idéia intuitiva é que dois conjuntos a e b “têm o mesmo tamanho”
(ou seja, o cardinal de a é igual ao cardinal de b) se existe uma bijeção entre
eles, isto é, se são equipolentes. Portanto a definição natural de cardinal de um
=
conjunto a, denotado por a, é a coleção de todos os conjuntos b equipolentes
com a. Isto é, a partir da relação de equivalência ≈ (equipolência), definimos
=
a = {b : a ≈ b}.

Portanto o cardinal de um conjunto a, na concepção de Frege e Russell, é a classe


de equivalência de a na relação ≈. O problema que apresenta esta definição é
=
que a é uma classe própria, isto é, o cardinal de a não pode ser legitimado em
= S=
ZF (nem em ZFC); se a fosse legitimado, podemos provar que a é o conjunto
de todos os conjuntos, uma contradição. A solução para este problema é definir
o cardinal de um conjunto a partir da teoria de ordinais. A definição é feita
de maneira a escolher um conjunto (ordinal) equipolente a x; de fato, o ordinal
escolhido será o menor ordinal equipolente com x. Como já parece evidente, a
teoria de cardinais faz um uso pesado do Axioma da Escolha [AE]. A partir de
[AE] poderemos provar a Lei de Tricotomia que estabelece que a relação  é
total entre conjuntos (isto é, dados x e y, então x  y ou y  x), assim como

73
demonstrar que todo conjunto é similar a um ordinal (o teorema da boa ordem:
todo conjunto x admite uma boa ordem). Na primeira parte desta exposição
não utilizaremos [AE], mas ele deverá ser considerado posteriormente, fato que
será oportunamente informado. Começamos reformulando a noção de conjunto
finito, agora utilizando a representação dos números naturais em ZF.

Definição 15.1 F IN (x) denota (∃n)(n ∈ ω ∧ x ≈ n)


(“x é n-finito”);
IN F IN (x) denota ¬F IN (x)
(“x é infinito”);
EN U M (x) denota x ≈ ω
(“x é enumerável”).

Antes de provar as seguintes propriedades precisamos do seguinte resultado.

Lema 15.2 Seja α um inteiro. Então α ≺ α + 1.

Demonstração: Seja α um inteiro, e f : α−→ α + 1 dada por f (x) = x; logo


f é injetora, portanto α  α + 1, pela definição de . Provaremos por indução
matemática que (∀x)ψ(x), onde

ψ(x) ≡def int(x) → (x 6≈ x + 1).

É imediato que 0 6≈ 1 = 0+1, portanto vale ψ(0). Suponha que vale ψ(y); para
provar ψ(y+1), suponha que y+1 é um inteiro, logo y é um inteiro, pois y ∈ y+1,
portanto y 6≈ y + 1. Suponhamos que existe uma bijeção f : y + 1−→(y + 1) + 1;
daqui inferimos que f |y é uma bijeção entre y e ((y + 1) + 1) − {f (y)}.
Fato: Seja z um conjunto, e v ∈ z + 1. Portanto (z + 1) − {v} ≈ z.
Com efeito, se v = z então (z + 1) − {v} = z, e a equipolência é imediata. Por
outro lado, se v ∈ z então definimos g : ((z + 1) − {v})−→z como g(u) = u se
u 6= z, e g(z) = v. É claro que g é uma bijeção; isto conclui a prova do Fato.
Vemos então que, por um lado, f |y é uma bijeção estabelecendo que y ≈ ((y +
1) + 1) − {f (y)} enquanto que, por outro lado, ((y + 1) + 1) − {f (y)} ≈ y + 1,
em virtude do Fato; portanto y ≈ y + 1, uma contradição. Daqui obtemos que
y +1 6≈ (y +1)+1. Desta maneira ψ(y) implica int(y +1) → y +1 6≈ ((y +1)+1),
isto é, provamos que ψ(y) → ψ(y + 1). Por indução matemática obtemos que
(∀x)(int(x) → ψ(x)) ou, equivalentemente, (∀x)ψ(x), isto é, α 6≈ α + 1 para
todo inteiro α. Como α  α + 1, então deduzimos que α ≺ α + 1 para todo
inteiro α. 

Proposição 15.3 (i) Em S vale o seguinte: se x e y são inteiros, então x  y


sse x ≤ y.
(ii) Em Z vale o seguinte: ω é infinito.

Demonstração: (i) Provaremos por indução matemática que para todo x vale
ψ(x), onde

ψ(x) ≡def int(x) → (∀y)(int(y) → (x  y → x ≤ y)).

74
É imediato que ψ(0) é verdadeira (confira!). Seja x tal que ψ(x) é verdadeira.
Para provar ψ(x + 1), assuma que x + 1 é um inteiro; logo x é um inteiro, donde

(∗) (∀y)(int(y) → (x  y → x ≤ y))

pois vale ψ(x). Suponha que y é um inteiro tal que x + 1  y. Como x ≺ x + 1


(pelo Lema 15.2), então x ≺ y; por (∗) inferimos que x < y (não poderiamos
ter x = y, senão x ≈ y, o que contradiz x ≺ y), portanto x + 1 ≤ y. Logo ψ(x)
implica ψ(x + 1). Por indução matemática obtemos que ψ(x) vale para todo x,
provando assim a primeira metade de (i). A outra implicação é imediata: x ≤ y
implica x  y para todo ordinal x e y.
(ii) Suponhamos que ω é n-finito, isto é, existe um inteiro n tal que ω ≈ n.
Daqui inferimos que ω ≈ n e n ≺ n + 1, pelo Lema 15.2, logo ω ≺ n + 1. Mas
n + 1 = n + 1, logo n + 1  ω (pois n + 1 ⊆ ω). Portanto n + 1  ω, ω ≺ n + 1
implica n + 1 ≺ n + 1, uma contradição. Daqui obtemos que ω é infinito. 

Definição 15.4 inic(α) denota ord(α) ∧ (∀β)(β < α → (α 6≈ β))


(“α é um ordinal inicial”).

Pela Proposição 15.3(i) vemos que todo ordinal n-finito n é um ordinal inicial:
se β ≈ n então β  n e n  β, donde β ≤ n e n ≤ β. Pela tricotomia dos
ordinais inferimos que β = n, e então β 6< n. Por 15.3(ii) e pela definição de ω
é imediato que ω é também um ordinal inicial. Por outro lado, é simples provar
que
ω ≈ ω + 1 ≈ ω + 2 ≈ ··· ≈ ω + ω = ω · 2 ≈ ω · 3 ≈ ···
junto com
ω
ω ≈ ω 2 ≈ ω 3 ≈ · · · ≈ ω ω ≈ ω ω ≈ · · · etc.
(confira!). Pode ser provado que nenhuma das operações sobre ordinais consegue
produzir um ordinal inicial superior a partir de ω. Para superar esta barreira
devemos considerar o conjunto das partes P(x); uma maneira possı́vel é através
da função aleph de Hartogs:

Definição 15.5 ℵ(x) denota {α : α  x}


(“o aleph de x”).

Proposição 15.6 Em ZF provamos que ℵ(x) é legitimado, e ℵ(x) é um ordinal


inicial para todo conjunto x.

Demonstração: Dado um conjunto x, considere o seguinte conjunto:

z = {r : (∃y)(y ⊆ x ∧ r ⊆ y × y ∧ bo(r, y))}.

Dado que z ⊆ P(x × x), então z é legitimado por [A2]. Por outro lado, lem-
brando que F (r) denota o conjunto dom(r)∪im(r), considere a seguinte fórmula:

75
isom(r, α) ≡def (∃h)(bij(h, F (r), α) ∧ (∀x)(∀y)(x, y ∈ F (r)
→ (((x r y) ↔ h(x) < h(y)))).

O teorema de caracterização dos ordinais prova que se r é uma boa ordem sobre
a = F (r), então (∃!α)isom(r, α) (onde (∃!) indica existência e unicidade). Logo,
a fórmula
ψ(r, α) ≡def bo(r, F (r)) ∧ isom(r, α)
satisfaz a condição F U Nψ do axioma de substituição [A7], portanto existe o
conjunto

b = {α : (∃r)(r ∈ z ∧ ψ(r, α))} = {α : (∃r)(r ∈ z ∧ isom(F (r), α)}.

Pela definição de z e dado que (∃!α)isom(F (r), α) para todo r ∈ z, sendo que
F (r) ⊆ x, vemos que b = ℵ(x), portanto o conjunto ℵ(x) é legitimado para todo
conjunto x. Para provar que ℵ(x) é um ordinal basta provar que é transitivo,
pois ℵ(x) é um conjunto de ordinais. Considere então α ∈ ℵ(x) e β < α. Logo:
β ⊆ α e α  x, donde β  x. Daqui β ∈ ℵ(x) e ℵ(x) é transitivo, sendo
portanto um ordinal. Suponha que existe β < ℵ(x) tal que ℵ(x) ≈ β. Dado
que β ∈ ℵ(x), então obtemos que β  x, donde ℵ(x)  x. Daqui ℵ(x) ∈ ℵ(x),
uma contradição. Logo ℵ(x) é um ordinal inicial. 

Observe que, se α é um ordinal, então α ∈ ℵ(α), pois α  α. Portanto α < ℵ(α).


Isto significa que, para cada ordinal α, existe um ordinal inicial ℵ(α) maior do
que α. Pelo Teorema de Cantor-Schröder-Bernstein ℵ(α) deve ser o seguinte
ordinal inicial. Com efeito, suponha que β é um ordinal inicial diferente de
ℵ(α) tal que α < β. Pela lei de tricotomia para ordinais temos que β < ℵ(α) ou
ℵ(α) < β. Suponhamos que β < ℵ(α), logo β ∈ ℵ(α) e então β  α. Por outro
lado, α < β implica α ⊆ β donde α  β. Pelo Teorema de Cantor-Schröder-
Bernstein inferimos que β ≈ α, sendo que α < β e β é um ordinal inicial,
contradição. Portanto ℵ(α) < β, isto é: ℵ(α) é o mı́nimo ordinal inicial maior
que α.

Definição 15.7 Por recursão transfinita definimos a seguinte seqüência de or-


dinais iniciais infinitos:

ℵ0 = ω;
ℵα+1 =
S ℵ(ℵα );
ℵλ = β<λ ℵβ se λ é um ordinal limite.

Como foi feito anteriormente, podemos provar que a definição por recursão
transfinita 15.7 é legitimada em ZF, e que ℵα é um ordinal inicial infinito para
todo ordinal α (conferir!). Reciprocamente, por indução transfinita podemos
provar que se α é ordinal inicial infinito, então existe um ordinal β tal que
α = ℵβ . Logo: inic(α) ∧ IN F IN (α) ↔ (∃β)(α = ℵβ ) é um teorema em ZF.

Definição 15.8 Um cardinal é um ordinal inicial.

76
Portanto, todo cardinal infinito é da forma ℵα para algum ordinal α. Uma
notação alternativa para ℵα é ωα . Por indução transfinita podemos provar o
seguinte resultado, que utilizaremos para definir as operações aritméticas entre
cardinais:

Proposição 15.9 Em ZF vale o seguinte: Se α é um cardinal e ω ≤ α, então


α ≈ (α × α).

Se α é um ordinal, então para todo ordinal β: β ≈ α implica que β  α,


portanto β ∈ ℵ(α). Desta maneira existe por [A2] o conjunto

aα = {β : β ∈ ℵ(α) ∧ β ≈ α} = {β : β ≈ α}.

Temos que α ≈ α, portanto aα 6= ∅. Daqui inferimos que existe o conjunto


= \ \
α= aα = {β : β ≈ α}.

= =
O conjunto α é dito o cardinal de α. Pode ser provado que α é um cardinal, e
=
que α = α se α é um cardinal. Se x é um conjunto e x ≈ α para algum ordinal
α então β ≈ x sse β ≈ α para todo ordinal β, portanto existe
= \ =
x ≡def {β : β ≈ x} = α.

Definição 15.10 Seja x um conjunto. O cardinal de x é definido como


 T
 {β : β ≈ x} se x ≈ α para algum ordinal α
=
x= .
∅ em caso contrário

Teorema 15.11 (Princı́pio da Boa Ordem) Em ZFC (isto é, em ZF mais o


axioma da escolha) provamos o seguinte: todo conjunto x admite uma boa ordem
r em x.
= T
Daqui temos que para todo conjunto x existe x = {β : β ≈ x}. Com
efeito, se x é um conjunto, então existe uma boa ordem r em x; pelo teorema
de caracterização dos ordinais existe um único ordinal α isomorfo a hx, ri; em
= T
particular x ≈ α. Pela Definição 15.10 obtemos que x = {β : β ≈ x}.
Devemos observar que, de fato, o axioma da escolha é equivalente ao princı́pio
da boa ordem. Por outro lado, o cardinal de um conjunto é determinado pelas
diferentes possibilidades que existem para definir uma boa ordem r em x; cada
r determina um ordinal α isomorfo a hx, ri, portanto o mı́nimo desses ordinais
corresponde à única boa ordem sobre x que o faz um cardinal.

Proposição 15.12 Seja b um conjunto e β um ordinal tal que b  β. Con-


sidere a seguinte relação em b: x r y sse f (x) < f (y) onde f é uma função
injetora de b em β. Logo r é uma boa ordem em b tal que, se α é o tipo ordinal
de hb, ri, então α ≤ β.

77
Demonstração: É imediato que r é uma boa ordem em b, pois r é computada
a partir da cópia f “b de b em β na relação de boa ordem ∈. Seja h : b−→α o
isomorfismo entre b e o tipo ordinal α de b dado por
h(x) = {h(y) : y r x} = {h(y) : f (y) < f (x)}.
Logo, h(x) < h(y) sse x r y sse f (x) < f (y). Definimos uma função g : α−→ β
dada por g(γ) = f (x) onde x é o único elemento de b tal que γ = h(x). Logo g
é uma função satisfazendo
γ = h(x) < h(y) = δ sse g(γ) = f (x) < f (y) = g(δ)
portanto g é um isomorfismo entre α e g“α. Logo g(γ) = γ para todo γ ∈ α
(pelo Fato 2 na demonstração do Teorema 14.4) e então α ≤ β. 

Corolário 15.13 Sejam b e c conjuntos. Em ZFC vale o seguinte: se b ⊆ c


= =
então b ≤ c.
= T
Demonstração: Seja x ∈ b = {β : β ≈ b}. Queremos provar que x ∈
= T
c = {β : β ≈ c}. Seja então β um ordinal equipolente com c, e considere
f : c−→ β uma bijeção. Logo f |b é uma bijeção entre b e f “b ⊆ β, donde b  β.
Considere o ordinal α ≤ β da Proposição 15.12. Logo α ≈ b donde x ∈ α, pois
= = = =
x ∈ b. Mas α ⊆ β, portanto x ∈ β. Provamos assim que x ∈ c, e então b ⊆ c,
= =
donde b ≤ c. 

Definição 15.14 Uma famı́lia de conjuntos indexada por um conjunto I é um


conjunto
(xi )i∈I = {hi, xi i : i ∈ I}
onde xi é um conjunto para cada i ∈ I. Mais formalmente, uma famı́lia (xi )i∈I
é uma função x : I−→a tal que I e a são conjuntos,
S com I 6= ∅. Se i ∈ I
então x(i) é denotado por xi . Por outro lado, i∈I xi denota o conjunto
[
{z ∈ a : (∃i)(i ∈ I ∧ z ∈ xi )}.
S S
Isto é, i∈I xi = im(x). O produto cartesiano de (xi )i∈I é dado por
Y [
xi = {f : f un(I, xi ) ∧ (∀i)(i ∈ I → f (i) ∈ xi )}.
i∈I i∈I

Definição 15.15 Seja L (κi )i∈I uma famı́lia indexada de cardinais.


(i) A soma cardinal i∈I κi é o cardinal κ construı́do da maneira seguinte: se
(ai )i∈I é uma famı́lia de conjuntos dois a dois disjuntos (isto é, ai ∩ aj = ∅ se
= S
i 6= j) tal que a i = κi para todo i ∈ I então κ é o cardinal do conjunto i∈I ai .
Se I = {0, 1} escreveremos J κ0 ⊕ κ 1 .
(ii) O produto cardinal i∈I κi é o cardinal κ construı́do da maneira seguinte:
=
se (ai )i∈I é uma famı́liaQde conjuntos tal que a i = κi para todo i ∈ I então κ é
o cardinal do conjunto i∈I ai . Se I = {0, 1} escreveremos κ0 κ1 .
(iii) Se κ, θ são cardinais, definimos a exponenciação cardinal κθ como sendo
= =
o cardinal µ dado pelo cardinal do conjunto xy , onde x = κ e y = θ.

78
Vemos que sem o axioma da escolha não podemos assegurar que existem estas
operações para I infinito, pois nada garante a existência dos conjuntos ai tais
=
que a i = κi para todo i ∈ I nem a existência da soma e o produto cardinal. O
axioma da escolha nos assegura que estas operações existem e são bem definidas,
isto é, independem dos conjuntos escolhidos para a sua realização. Observemos
que κθ é um caso particular de produto cardinal, em que I = θ e κi = κ
para todo i ∈ θ. Algumas propriedades das operações entre cardinais são as
seguintes (no caso em que a propriedade requer do axioma da escolha, isto é
indicado acrescentando “([AE])” no inı́cio do enunciado).

Proposição 15.16 As operações entre cardinais satisfazem as propriedades


seguintes:
(i) κ ⊕ λ = λ ⊕ κ, κ λ = λ κ.
(ii) κ ⊕ (λ ⊕ θ) = (κ ⊕ λ) ⊕ θ, κ (λ θ) = (κ λ) θ.
(iii) Se κ ≤ λ então κ ⊕ θ ≤ λ ⊕ θ e κ θ ≤ λ θ.
(iv) κ (λ ⊕ θ) =L (κ λ) ⊕ (κ
L θ).
(v) ([AE]) κ ( i∈I λi ) = i∈I (κ λi ).
L =
(vi) ([AE]) Se κi = κ para todo i ∈ I, então i∈I κi = I κ.
(vii) κ ⊕ λ é o cardinal do ordinal κ + λ, e κ λ é o cardinal do ordinal κ · λ.

Suponha que β é um cardinal. Estamos interessados em encontrar o mı́nimo


cardinal α tal que existe uma partição de β em α pedaços de cardinalidade es-
tritamente menor do que β. Esse cardinal mı́nimo α é a cofinalidade de β, e será
denotado cf (β). No caso em que β é um cardinal tal que cf (β) = β dizemos que
β é regular. Por exemplo, ω não pode ser particionado numa quantidade finita
de subconjuntos finitos; para cobrir todo ω por uma partição de subconjuntos
finitos precissamos de ω subconjuntos; portanto ω é um cardinal regular.

Definição 15.17 Sejam α e β ordinais. S


α cf β denota α ≤ β ∧ (∃f )(f un(f, α, β) ∧ β = im(f ))
(“α é cofinal em
T β”).
cf (β) denota {α : α cf β}
(“a cofinalidade de β”).

Dado que α cf β implica que α ≤ β (donde α ∈ β + 1) então Cβ = {α : α cf


β} ⊆ β + 1, portanto Cβ é legitimado por [A2]. Por outro lado β cf β, portanto
Cβ 6= ∅ Se então existe cf (β) para todo ordinal β. Se α cf β e f : α−→ β
tal que im(f ) = S β então, para cada γ ∈ β existe δ ∈ α tal que γ ∈ f (δ),
pela definição de . Ou seja, para cada γ ∈ β existe δ ∈ α tal que γ < f (δ).
Em outras palavras, a imagem de f não é limitada em β, portanto f é uma
seqüência
S em β (indexada por α) convergendo a β (a convergência é dada pela
união ). Observe que se β = α + 1 então cf (β) = 1. Com efeito, 1 cf (α + 1)
via f (0) = α.

Proposição 15.18 Sejam α e β ordinais limites. Em ZF vale o seguinte:


(i) α cf β é uma relação transitiva.
(ii) cf (β) é um cardinal.

79
Definição 15.19 Seja κ um cardinal. Dizemos que κ é regular se cf (κ) = κ.
Em caso contrário, isto é, se cf (κ) < κ, então κ é dito singular.

Proposição 15.20 Em ZFC vale o seguinte:


(i) ω é regular.
(ii) ℵα+1 é regular para todo α.
(iii) Se λ é um ordinal limite então cf (ℵλ ) = cf (λ).

Observe que, pela proposição anterior, cf (ℵω ) = cf (ω) = ω. Por exemplo, ℵω


pode ser atingido pela seqüência

ℵ0 < ℵ1 < ℵ2 < · · · −→ℵω

provando que ℵω é singular. Também temos que cf (ℵℵω ) = ω, considerando,


por exemplo, a seqüência

ℵℵ0 < ℵℵ1 < ℵℵ2 < · · · −→ℵℵω .

Finalmente, discutiremos brevemente a Hipótese do Contı́nuo (HC). Temos


duas maneiras para passar de um cardinal a outro superior: considerar ℵ(κ) > κ
ou, pelo teorema de Cantor, considerar 2κ > κ. A Hipótese do Contı́nuo afirma
o seguinte:

(HC) 2ℵ 0 = ℵ 1 .

Dado que R ≈ 2ℵ0 então (HC) afirma que todo subconjunto de R não enu-
merável é equipolente com R, isto é, não existem subconjuntos de R de cardi-
nalidade intermediária entre ℵ0 e a cardinalidade de R. Portanto (HC) afirma
que 2κ e ℵ(κ) coincidem no primeiro valor ℵ0 . A Hipótese Generalizada do
Contı́nuo (HGC) afirma que estas funções coincidem em todo cardinal κ. Em
outras palavras, para cada cardinal infinito κ não existe um cardinal estrita-
mente entre κ e 2κ . Em termos da função ℵ temos que (HGC) afirma que

(HGC) 2ℵα = ℵα+1

para todo ordinal α. Com a ajuda de (HGC) resolvemos todas as questões


acerca das potências cardinais:

Teorema 15.21 Assumamos (HGC). Em ZFC temos que ℵαβ é determinado,
sendo que

(i) ℵαβ = ℵβ+1 se α ≤ β;

(ii) ℵαβ = ℵα se ℵβ < cf (ℵα );

(iii) ℵαβ = ℵα+1 se cf (ℵα ) ≤ ℵβ ≤ ℵα .

Em 1936 Kurt Gödel demonstrou que, se a teoria ZF é consistente, então ZF C


com o acréscimo de (HC) é consistente. Por outro lado, Cohen demonstrou em
1964 (mediante a técnica de forcing) que, se a teoria ZF é consistente, então
ZF C com o acréscimo da negação de (HC) também é consistente, portanto a

80
Hipótese do Contı́nuo é indecidı́vel na teoria ZF C. Também foi provado por
Cohen que, se a teoria ZF é consistente, então ZF com o acréscimo da negação
de [AE] também é consistente. Vemos assim que, em particular, tanto ZF
com o acréscimo de [AE] quanto ZF com o acréscimo da negação de [AE] são
consistentes, desde que ZF seja consistente. Assim, ambas teorias de conjuntos
são válidas, e a inclusão do Axioma da Escolha ou da sua negação acaba sendo
uma questão de escolha.
Devemos observar, finalmente, que os famosos teoremas de incompletude de
Gödel se aplicam a ZF , portanto existem sentenças de ZF que são indecidı́veis
em ZF . Em particular, se ZF é consistente, então ZF não pode provar a sua
própria consistência.

References
[1] C.A. di Prisco, Una Introducción a la Teorı́a de Conjuntos, Coleção
CLE, vol. 20, (UNICAMP), 1997.

[2] F.R. Drake, Set Theory: an Introduction to Large Cardinals,


North Holland, 1974.

[3] H.B. Enderton, Elements of Set Theory, Academic Press, 1977.

[4] T. Jech, Set Theory, Springer Verlag (segunda edição), 2002.

[5] P. Suppes, Axiomatic Set Theory, Dover, 1972.

81

You might also like