Teoria Axiomática Dos Conjuntos

Teoria Axiomática de Conjuntos:
Uma Introdução
Marcelo Esteban Coniglio
GTAL, Departmento de Filosofia
Universidade Estadual de Campinas
P.O. Box 6133, 13081-970
Campinas, SP, Brazil
E-mail: coniglio@cle.unicamp.br
Abstract
O presente texto corresponde às notas de aula do curso HF005-Teoria
de Conjuntos, do Programa de Pós-Graduação em Filosofia da UNICAMP,
que ministrei no segundo semestre de 1997. Trata-se principalmente de
uma adaptação do livro Axiomatic Set Theory, de P. Suppes (Dover, 1972).
Alguns tópicos (principalmente, teoria de ordinais e de cardinais) foram
adaptados do livro Set Theory: an Introduction to Large Cardinals, de
F.R. Drake (North Holland, 1974).
Contents
Introdução 3
1 Teoria Cumulativa de Tipos 4
2 Axiomas Básicos da Teoria de Conjuntos 5
3 Axiomas Adicionais 9
4 Produtos Cartesianos 13
5 Relações em S 16
6 Relações de Ordem 19
7 Relações de Equivalência 24
8 Funções 29
9 Equipolência 33
10 Conjuntos Finitos 40
11 Axiomas Finais de ZF . O Axioma da Escolha 46
1
12 Introdução aos Ordinais 49
13 Indução e Recursão Transfinita 54
14 Aritmética Ordinal 62
15 Cardinais 73
2
Introdução
A Teoria de Conjuntos (TC) ocupa um lugar privilegiado dentre as disciplinas
da Matemática moderna: todas as entidades estudadas na matemática (com
algumas exceções) podem ser consideradas conjuntos. Portanto, as questões
acerca da natureza da matemática são basicamente questões acerca de conjun-
tos.
A TC foi iniciada a partir das pesquisas de Georg Cantor em 1870 sobre
a teoria das séries infinitas em Análise; a partir destes trabalhos, Cantor foi
levado a considerar conjuntos infinitos ou classes de caráter arbitrário. Mas
o que são os conjuntos? A nossa idéia intuitiva os define como coleções de
objetos. Segundo Cantor, “um conjunto é uma coleção, considerada como um
todo, de objetos distintos e definidos da nossa intuição ou pensamento. Os
objetos são chamados de elementos do conjunto”. Os paradoxos surgidos logo
no inı́cio do estudo da teoria mostraram que a concepção “ingênua” de Cantor
não podia formar uma base satisfatória para a TC, e muito menos para a
Matemática. Isto levou a uma reformulação dos princı́pios básicos da teoria.
Os paradoxos apareceram principalmente pelo uso indiscriminado das noções de
conjunto, número cardinal e ordinal, etc. Um paradoxo consiste na derivação no
sistema lógico de ϕ e ¬ϕ para alguma afirmação ϕ, ou então a derivação de uma
afirmação da forma ϕ ↔ ¬ϕ. O primeiro paradoxo foi descoberto pelo próprio
Cantor em 1895 e não foi publicado imediatamente, mas foi redescoberto por
Burali-Forti em 1897, que também não conseguiu fornecer uma solução. O
paradoxo surgiu com relação à teoria dos ordinais, num estágio relativamente
avançado da teoria, e não foi levado muito a sério. A aparição em 1902 do célebre
paradoxo de Russell fez mudar as coisas, pois ele surge no primeiro estágio da
teoria: dado que, pelo axioma de compreensão, podemos definir os conjuntos
{x : ϕ(x)}, onde ϕ(x) é uma fórmula denotando uma propriedade, então é
lı́cito formular o conjunto A = {x : x 6∈ x} (considerando ϕ(x) ≡def x 6∈ x).
Logo, podemos nos perguntar se é o caso que A ∈ A ou não é o caso que A ∈ A,
obtendo: A ∈ A sse A 6∈ A!! Este fato causou uma verdadeira revolução no
méio acadêmico ligado à fundamentação da matemática, obrigando Dedekind a
suspender a publicação do seu ensáio sobre a natureza dos números. Enquanto
isso, Frege acabara de publicar sua obra prima, fruto de décadas de esforços,
admitindo por fim que um dos pilares do seu edifı́cio tinha sido sacudido por
Russell.
Os paradoxos tem uma origem antiga: o exemplo clássico é o Paradoxo do
Mentiroso (Epimênides), que pode ser formulado simplesmente como: “Esta
frase é falsa”. É claro que supor a verdade ou a falsidade da frase leva a uma
contradição. O paradoxo de Grelling-Nelson (1908) diz o seguinte: defina como
heterológicos os adjetivos tais que eles mesmos não satisfazem a propriedade
que eles denotam. Por exemplo, “inglês”, “azul” ou “frio” são heterológicos,
enquanto que “polissilábico” ou “português” não o são; em sı́mbolos, dado
um adjetivo “S”, temos que “S” é heterológico sse “S” não é (não satisfaz) S.
Logo, “heterológico” é heterológico sse “heterológico” não é heterológico. O
paradoxo de Richard (1905) diz o seguinte: considere os números reais entre 0
e 1 que podem ser definidos por um número finito (não limitado) de palavras
3
em português: por exemplo, “ponto cinco”, “o maior número tal que elevado
ao quadrado e multiplicado por três é igual a dois”. Os números definidos desta
maneira podem ser enumerados (só temos uma quantidade enumerável de frases
de tamanho finito). Considere o seguinte número: “o número real entre 0 e 1
cuja n-ésima casa decimal é três se a n-ésima casa decimal do n-ésimo número é
cinco, e é cinco em caso contrário”. Logo, esta frase define um número diferente
de todos os números da lista, uma contradição (este paradoxo é baseado no
método diagonal de Cantor para provar que o conjunto dos números reais não
é enumerável). Ramsey distingue dois tipos de paradoxos: os semânticos e
os lógicos. Todos os paradoxos mencionados acima (com exceção do paradoxo
de Russell) são semânticos; dentre os paradoxos lógicos podemos mencionar o
paradoxo de Russell, o de Cantor e o de Burali-Forti. O paradoxo de Cantor
(1899) diz: considere U o conjunto de todos os conjuntos. Logo, o conjunto
P(U ) das partes de U tem cardinal estritamente maior do que o cardinal de
U , o que contradiz a hipótese de que U seja o maior conjunto. O paradoxo de
Burali-Forti (1897) diz: o conjunto bem ordenado W de todos os ordinais tem
um ordinal maior que todo elemento de W , portanto maior que todo ordinal.
1 Teoria Cumulativa de Tipos

Todos os paradoxos vistos têm a mesma origem: a auto-referência. No caso dos
paradoxos em TC, podemos solucionar o problema considerando que os conjun-
tos são formados em etapas ou estágios; assim, um conjunto só pode ser criado
a partir de conjuntos que já foram definidos ou criados anteriormente. Isto dá
origem à teoria simples de tipos:
Nı́vel 0: alguns indivı́duos (urelemente), sem propriedades especı́ficas.

Nı́vel 1: todas as coleções formadas por indivı́duos.
Nı́vel 2: todas as coleções formadas por elementos no nı́vel 1, etc.
Assim, se os indivı́duos são os números naturais, então 3 é um conjunto no

nı́vel 0, {1, 2} está no nı́vel 1, e {{2}, {4, 6}} está no nı́vel 2. As questões são:
(a) qual é o problema em considerar {1, {1}} como conjunto? (b) o conjunto
vazio ∅, assumindo que seja um indivı́duo, seria diferente nas diferentes etapas
em que pudesse aparecer? Com relação à (a), é óbvio que o modelo é restritivo
demais, logo consideramos a teoria cumulativa de tipos:
Nı́vel 0: alguns indivı́duos.

Nı́vel 1: todas as coleções formadas por indivı́duos.
Nı́vel 2: todas as coleções formadas por elementos no nı́vel 0 ou 1.
Em cada nı́vel, considerar as coleções cujos elementos estão em nı́veis
anteriores.
Logo, {1, {1}} aparece no nı́vel 2, no nosso exemplo. Com relação à (b), temos
que assumir que uma vez que um conjunto aparece num nı́vel, toda aparição
posterior é a mesma. As questões seguintes são: quantos indivı́duos deveriam
4
ser tomados? os nı́veis têm final? Com relação à primeira questão, parece
claro que ∅ deveria ser considerado o único indivı́duo; isto equivale a não tomar
indivı́duos (logo, ∅ será o único conjunto do nı́vel 1). Com relação à segunda
questão, a resposta é “não”. Se existisse um máximo nı́vel α, é claro que
poderiamos criar um nı́vel adicional α+1 com os conjuntos que temos definidos,
uma contradição.
2 Axiomas Básicos da Teoria de Conjuntos

A primeira axiomatização de TC foi dada por Zermelo em 1908, e modificada
por Fraenkel em 1922, dando origem ao sistema Zermelo-Fraenkel (ZF ). Ex-
istem muitos outros sistemas, como o de von Neumann-Gödel-Bernays (N GB)
e o de Kelley-Morse (KM ). Estes últimos usam classes juntamente com con-
juntos. Uma classe pode ser pensada como uma coleção “enorme”, de maneira
que os conjuntos viriam ser classes “pequenas”. Por exemplo,
V = {x : x = x}
é a coleção de todos os conjuntos, chamada de classe universal. V é uma

classe própria, isto é, ela não é um conjunto, portanto não aparece em nenhum
nı́vel da hierarquia cumulativa. Se todos os membros de uma classe aparecem
antes de um dado nı́vel, então a classe é um conjunto nesse nı́vel. Neste curso
estudaremos apenas ZF .
A formulações ZF de TC é realizada numa linguagem de primeira ordem,
utilizando constantes para os (eventuais) indivı́duos, duas relações binárias (=,
∈), os conectivos ∨, ∧, ¬, → , ↔ , e os quantificadores ∀ (para todo) e ∃
(existe), junto com um repertório enumerável de variáveis. As variáveis são
denotadas: a, b, . . . , x, y, z (com ou sem ı́ndices). Como é usual, as fórmulas
¬(x = y) e ¬(x ∈ y) serão denotadas por (x 6= y) e (x 6∈ y), respectivamente.
Começamos enunciando o primeiro axioma de ZF :
Axioma de Extensionalidade:
[A1] (∀z)(z ∈ x ↔ z ∈ y) → (x = y)
Aqui é evidenciada a intenção de que, quando uma coleção aparecer em dife-

rentes nı́veis, ela seja considerada como sendo a mesma; por outro lado, é
estabelecido que o que interessa com relação aos conjuntos são os seus e-
lementos, mais do que o que eles são. Observe que a implicação recı́proca
(x = y) → (∀z)(z ∈ x ↔ z ∈ y) é logicamente válida.
Axioma de Compreensão ou Separação:
[A2] (∃y)(∀x)(x ∈ y ↔ (x ∈ a ∧ ϕ(x)))
Isto significa que estamos “separando” alguns elementos de a, exatamente aque-

les que satisfazem a propriedade ϕ. Aqui, ϕ(x) é uma fórmula onde x aparece
5
livre, podendo aparecer outras variáveis livres em ϕ (os parâmetros do con-
junto criado), mas a variável y não aparece livre em ϕ. O axioma de
compreeensão tenta tomar, em cada estágio, todos os conjuntos já criados,
para formar os conjuntos do nı́vel seguinte. O axioma é limitado, pois só
tomamos os conjuntos formados pelas fórmulas ϕ. Observe que [A2] é um
axioma-esquema, isto é, cada fórmula ϕ determina um axioma. A condição
sobre y não ocorrer livre em ϕ está relacionada com a auto-referência, e é fun-
damental para evitar o paradoxo de Russell; caso contrário, podemos considerar
(∃a)(∀x)(x ∈ a ↔ x = b) (esta fórmula é demonstrável em ZF , como veremos
depois de incorporar outros axiomas) e ϕ(x, y) ≡def x 6∈ y em [A2]; logo, te-
remos: x ∈ y ↔ (x ∈ a ∧ x 6∈ y), e então x ∈ a → (x ∈ y ↔ x 6∈ y) para todo
x. Portanto, tomando a como acima, teremos: x = b → (x ∈ y ↔ x 6∈ y) para
todo x, donde, tomando b no lugar de x, obtemos b ∈ y ↔ b 6∈ y, contradição.
Como provaremos na Proposição 11.1, o axioma [A2] será dedutı́vel dos outros
axiomas de ZF (especificamente, [A2] é um caso particular do axioma [A7], a
ser introduzido na Seção 11). Porém, na primeira parte deste texto faremos um
uso pesado do axioma [A2] sem precisar usar por enquanto o axioma mais forte
[A7].
A partir de agora adotaremos a seguinte notação: {x : ϕ} é um (meta)termo
s em que toda ocorrência de x é limitada (ϕ é uma fórmula). Logo,
s = t denota (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ z = t);

t = s denota (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ t = z);
s ∈ t denota (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ z ∈ t);
t ∈ s denota (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ t ∈ z)
onde z não ocorre em ϕ nem em t.

Assim, por exemplo, se s ≡def {x : ϕ(x)} e t ≡def {x : φ(x)} então s ∈ t
denota a fórmula (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ z ∈ t). Por sua vez, z ∈ t denota a
fórmula (∃u)((∀x)(x ∈ u ↔ φ) ∧ z ∈ u), portanto s ∈ t denota a fórmula
(∃z)((∀x)(x ∈ z ↔ ϕ) ∧ (∃u)((∀x)(x ∈ u ↔ φ) ∧ z ∈ u)).
Se (∃y)(∀x)(x ∈ y ↔ ϕ(x)) é demonstrado a partir dos axiomas, dizemos que

{x : ϕ(x)} é legitimado. Logo, o axioma de separação diz que o (meta)termo
{x : x ∈ a ∧ ϕ(x)}
é legitimado. Note que este (meta)termo depende de a (e das variáveis diferentes

de x que ocorrem livres em ϕ(x)).
Observação 2.1 Se si ≡def {x : ϕi (x)} é legitimado (i = 1, . . . , n), então

(∀x1 ) · · · (∀xn )φ(x1 , . . . , xn ) implica φ(s1 , . . . , sn ), onde φ(s1 , . . . , sn ) é a ex-
pressão obtida de φ substituindo xi por si (eliminando a posteriori os si apli-
cando as regras de redução definidas acima). Portanto, se s ≡def {x : ϕ(x)} é
legitimado, então de x ∈ y ↔ φ(x) deduzimos s ∈ y ↔ (∃z)((∀x)(x ∈ z ↔ ϕ(x))∧
φ(z)) e s ∈ y ↔ φ(s) (lembrando que devemos eliminar s para obter fórmulas a
partir dessas expresões).
6
Proposição 2.2 Suponha que s ≡def {x : ϕ(x)} é legitimado; logo, são demon-
stráveis:
x ∈ s ↔ ϕ(x), (s = y) ↔ (∀x)(x ∈ s ↔ x ∈ y) e
(s = y) ↔ (∀x)(x ∈ y ↔ ϕ(x)).
Demonstração: Sejam α ≡def (∃y)(∀x)(x ∈ y ↔ ϕ(x)) e β ≡def (∃y)((∀z)(z ∈

y ↔ ϕ(z))∧x ∈ y), isto é, β é x ∈ {x : ϕ(x)}; logo, α∧β implica β implica ϕ(x).
Por outro lado, ϕ(x)∧(x ∈ y ↔ ϕ(x)) implica x ∈ y, e então ϕ(x)∧α implica β.
Para provar a segunda equivalência, considere φ(z, y) ≡def (z = y) ↔ (∀x)(x ∈
z ↔ x ∈ y). Por [A1] vale (∀z)φ(z, y) e então, pela Observação 2.1 obtemos
φ(s, y), i.e., (s = y) ↔ (∀x)(x ∈ s ↔ x ∈ y). A última afirmação é uma con-
seqüência das duas primeiras.
Desta maneira, se s ≡def {x : ϕ(x)} e t ≡def {x : φ(x)} são legitimados,

então, para provar (s = t), basta provar ϕ(x) ↔ φ(x).
Axioma do Conjunto Vazio:
[VZ] (∃y)(∀x)(x 6∈ y)
Este axioma é redundante, pois pode ser deduzido de [A2]: considere ϕ(x) ≡def
(x 6= x); como (x ∈ y ↔ (x ∈ a ∧ x 6= x)) ∼ (x 6∈ y ↔ (x 6∈ a ∨ x = x)) ∼ (x 6∈
y ↔ (x = x)) ∼ x 6∈ y, então o axioma [VZ] se segue por [A2]. Assim, o termo
{x : x 6= x}, que será denotado ∅, é legitimado em ZF . Note que (s = ∅) sse
(∀x)¬ϕ(x), se s ≡def {x : ϕ(x)}.
Corolário 2.3 [A1], [A2] ` x 6∈ ∅.
Demonstração: Pela Proposição 2.2,
` (∃y)(∀x)(x ∈ y ↔ x 6= x) → (x ∈ ∅ ↔ x 6= x)
(note que o antecedente desta implicação expressa que ∅ ≡def {x : x 6= x} é

legitimado). Logo, [V Z] ` (x ∈ ∅ ↔ x 6= x), donde [A1], [A2] ` x 6∈ ∅.
Axioma do Par:
[PR] (∃y)(∀x)(x ∈ y ↔ ((x = a) ∨ (x = b)))
Este axioma afirma que existe o conjunto com a e b como únicos membros,
legitimando o termo {x : (x = a) ∨ (x = b)}, que será denotado {a, b} (note
que o nome do termo depende de a e b). Em função da hierarquia cumulativa,
o par {a, b} pode ser formado em qualquer estágio depois que a e b foram
formados; logo, não tem último estágio. O conjunto {a, a} será denotado {a},
sendo que contém a como único elemento. Este axioma é redundante, como
provaremos depois na Proposição 11.2. O axioma [PR] permitirá formar, junto
com o axioma [RF] da reunião finita a ser introduzido a seguir, os conjuntos
finitos da forma {a1 , . . . , an }.
7
Corolário 2.4 (a) [A1], [A2], [P R] ` x ∈ {a, b} ↔ (x = a) ∨ (x = b).
(b) [A1], [A2], [P R] ` x ∈ {a} ↔ x = a.
Adotemos a notação x ⊆ y e x ⊂ y para indicar as fórmulas
(∀z)(z ∈ x → z ∈ y) e (x ⊆ y) ∧ (x 6= y),
respectivamente. É claro que s ⊆ t ↔ (∀x)(ϕ(x) → φ(x)) se s ≡def {x : ϕ(x)}

e t ≡def {x : φ(x)} são legitimados.
Axioma da Reunião Finita:
[RF] (∃y)(∀x)(x ∈ y ↔ (x ∈ a ∨ x ∈ b))
Aqui estabelecemos que a ∪ b ≡def {x : (x ∈ a) ∨ (x ∈ b)} é legitimado. Este

axioma será redundante na presença dos outros axiomas, como provaremos na
Proposição 3.2. Por outro lado, a ∩ b ≡def {x : (x ∈ a) ∧ (x ∈ b)} é legitimado,
por [A2]. Logo, podemos provar o seguinte:
Proposição 2.5 (a ∪ b) ∩ c = (a ∩ c) ∪ (b ∩ c), e (a ∩ b) ∪ c = (a ∪ c) ∩ (b ∪ c).
Demonstração: x ∈ (a ∪ b) ∩ c sse x ∈ (a ∪ b) ∧ x ∈ c sse (x ∈ a ∨ x ∈ b) ∧ x ∈ c
sse (x ∈ a∧x ∈ c)∨(x ∈ b∧x ∈ c) see (x ∈ a∩c)∨(x ∈ b∩c) sse x ∈ (a∩c)∪(b∩c).
A outra afirmação é provada analogamente.
Por [A2], a − b ≡def {x : (x ∈ a) ∧ (x 6∈ b)} é legitimado.

Proposição 2.6 a − (a ∩ b) = a − b.
Demonstração: x ∈ a−(a∩b) sse x ∈ a∧x 6∈ (a∩b) sse x ∈ a∧¬(x ∈ a∧x ∈ b)
see x ∈ a ∧ (x 6∈ a ∨ x 6∈ b) sse (x ∈ a ∧ x 6∈ a) ∨ (x ∈ a ∧ x 6∈ b) see x ∈ a ∧ x 6∈ b
see x ∈ a − b.
Exercı́cios 2.7 Provar na TC obtida até agora o seguinte:

(1) x ⊆ x; (x ⊆ y ∧ y ⊆ x) → (x = y); (x ⊆ y ∧ y ⊆ z) → (x ⊆ z).
(2) ∅ ⊆ x; (x ⊆ ∅) → (x = ∅).
(3) ¬(x ⊂ x); (x ⊂ y) → ¬(y ⊂ x).
(4) a ∩ b e a − b são legitimados.
(5) a∩b = b∩a; (a∩b)∩c = a∩(b∩c); a∩∅ = ∅; a∩b ⊆ a; (a ⊆ b) ↔ (a∩b = a).
(6) (a ⊆ b) ↔ (a ∪ b = b); a ∪ ∅ = a; a ⊆ a ∪ b.
(7) a ∩ (a − b) = a − b; (a − b) ∪ b = a ∪ b; (a ∪ b) − b = a − b; a − (b ∪ c) =
(a − b) ∩ (a − c); a − (b ∩ c) = (a − b) ∪ (a − c); (a ⊆ b) → (a − b = ∅).
(8) Obter o paradoxo de Russell a partir de (∃y)(∀x)(x ∈ y).
(9) Opinar sobre a verdade ou falsidade das seguintes afirmações:
(9.1) O termo {x : x = x} não pode ser legitimado.
(9.2) ϕ(x) → x ∈ {x : ϕ(x)}.
(9.3) {x : x ∈ y} = y.
(9.4) (∀x)(ϕ(x) → φ(x)) → ({x : ϕ(x)} ⊆ {x : φ(x)}).
(9.5) (∀x)(ϕ(x) ↔ ¬φ(x)) → ({x : ϕ(x)} = {x : φ(x)}).
8
(10) Sejam s ≡def {x : ϕ(x)} e t ≡def {x : φ(x)} legitimados. Então
s ∈ t ↔ (∃w)((∀x)(x ∈ w ↔ ϕ(x)) ∧ φ(w)).
(11) x ∈ a ↔ {x} ⊆ a.
Observação 2.8 A partir das expressões obtidas na Proposição 2.2 e no E-

xercı́cio 2.7 (10), vemos que podemos iterar os termos {x : ϕ}, uma vez que
eles são legitimados. Assim, se os (meta)termos
si ≡def {x : φi (x)} (i = 1, . . . , n) e {x : ϕ(x, x1 , . . . , xn , z1 , . . . , zk )}
são legitimados então, usando a Proposição 2.2, {x : ϕ(x, z1 , . . . , zk )} é legi-

timado, onde ϕ é obtida de ϕ substituindo xi por si e , a posteriori, (w ∈ si ),
(si ∈ w), (si = w), (si ∈ sj ) e (si = sj ) pela expressão correspondente (w
é uma variável que ocorre livre ou limitada em ϕ). Por exemplo, os termos
a∪b ≡def {x : x ∈ a∨x ∈ b} e s ≡def {a} ≡ {x : x = a} são legitimados, logo
{a} ∪ b é legitimado, obtido como {x : x ∈ s ∨ x ∈ b} ≡ {x : x = a ∨ x ∈ b}.
Se, por outro lado, queremos formar {s1 } ∪ s2 , onde si ≡def {x : φi (x)} são
legitimados (i = 1, 2) então teremos t1 ≡def {s1 } ≡ {x : x = s1 } ≡ {x :
(∀y)(y ∈ x ↔ φ1 (x)}, logo t1 ∪ s2 ≡def {x : x ∈ t1 ∨ x ∈ s2 } ≡ {x : (∀y)(y ∈
x ↔ φ1 (x)) ∨ φ2 (x)}. É nesse sentido que devemos entender, por exemplo, o
(meta)termo (a ∪ b) ∩ c ≡def {x : x ∈ (a ∪ b) ∧ x ∈ c} ≡ {x : (x ∈ a ∨ x ∈
b) ∧ x ∈ c} na Proposição 2.5.
3 Axiomas Adicionais
Nesta seção definiremos três axiomas adicionais da TC dada por ZF .
Axioma das Partes:
[A3] (∃y)(∀x)(x ∈ y ↔ (∀z)(z ∈ x → z ∈ a))
Este axioma garante en ZF que o conjunto {x : x ⊆ a} pode ser formado,

uma vez que a foi formado. A notação utilizada para este (meta)termo será
P(a). Como todo subconjunto de a será formado ao menos no nı́vel de a, então
P(a) aparecerá só no nı́vel seguinte. Logo, este axioma é verdadeiro na teoria
cumulativa de tipos, assumindo que não existe um máximo nı́vel.
Proposição 3.1 (1) a ∈ P(a); ∅ ∈ P(a) na TC introduzida até agora.

(2) Se s ≡def {x : φ(x)} e t ≡def {x : ϕ(x)} são legitimados em ZF , então
s ∈ P(t) sse s ⊆ t sse (∀x)(φ(x) → ϕ(x)); em particular, s ∈ P(s) e ∅ ∈ P(s).
(3) ZF ` P(∅) = {∅}.
(4) ZF ` P(P(∅)) = {∅, {∅}}.
(5) ZF ` a ⊆ b ↔ P(a) ⊆ P(b).
(6) ZF ` P(a) ∪ P(b) ⊆ P(a ∪ b).
(7) ZF ` P(a ∩ b) = P(a) ∩ P(b).
(8) ZF ` P(a − b) ⊆ (P(a) − P(b)) ∪ {∅}.
9
Demonstração: (1) a ∈ P(a) sse a ⊆ a. Pelo Exercı́cio 2.7 (10),
∅ ∈ P(a) ∼ (∃w)((∀x)(x ∈ w ↔ x 6= x) ∧ (∀x)(x ∈ w → x ∈ a)).
Logo, ∅ ∈ P(a) ∼ (∃w)((∀x)(x 6∈ w) ∧ (∀x)(x ∈ w → x ∈ a). Mas (∀x)(x 6∈ w)

implica (∀x)(x ∈ w → x ∈ a); portanto, pelo axioma do conjunto vazio obtemos
∅ ∈ P(a).
(2) Basta considerar ψ(x, y) ≡def (x ∈ P(y) ↔ x ⊆ y) e usar a Observação 2.1.
(3) P(∅) = {x : (∀y)(y ∈ x → y 6= y)} = {x : x = ∅} = {∅} (= {y : (∀z)(z 6∈
y)}).
(4) Por (3) temos que (y ∈ P(∅)) ↔ (∀z)(z 6∈ y). Assim,
P(P(∅)) = {x : (∀y)(y ∈ x → (∀z)(z 6∈ y))}

≡def {x : φ(x)}.
Por outro lado,
{∅, {∅}} = {x : x = ∅ ∨ x = {∅}}

= {x : (∀y)(y 6∈ x) ∨ (∀y)(y ∈ x ↔ (∀z)(z 6∈ y))}
≡def {x : ϕ(x)}.
Devemos provar então a equivalência de φ(x) e ϕ(x), as fórmulas que definem os
meta-termos P(P(∅)) e {∅, {∅}}, respectivamente. Partindo de ϕ(x), se assum-
imos α(x) ≡def (∃y)(y ∈ x) então obtemos φ(x), pois ϕ(x) ∼ (α(x) → φ(x)).
Assumindo ¬α(x) então também obtemos φ(x), porque nesse caso x = ∅, e
∅ ∈ P(s) para todo s legitimado, por (2). Assim,
ϕ(x), (x = ∅) ∨ (x 6= ∅) implica ψ,
portanto ϕ(x) implica φ(x), pelo Princı́pio do Terceiro Excluı́do. Analogamente

(analisando os casos em que x = ∅ ou x 6= ∅) provamos que φ(x) implica ϕ(x).
(5) Suponha que a ⊆ b, e seja x ∈ P(a). Se y ∈ x então y ∈ a, logo y ∈ b. Assim
y ∈ x implica y ∈ b, donde x ∈ P(b), isto é, P(a) ⊆ P(b). Reciprocamente,
suponha que P(a) ⊆ P(b). Como a ∈ P(a), então a ∈ P(b), donde a ⊆ b.
(6), (7) e (8): São deixados como exercı́cio.
Axioma da Reunião:
[A4] (∃y)(∀x)(x ∈ y ↔ (∃z)((x ∈ z) ∧ (z ∈ a))
Este axioma legitima em ZF o meta-termo

[
a ≡def {x : (∃z)((x ∈ z) ∧ (z ∈ a))},
S
definindo a reunião da coleção de conjuntos a; os elementos de a são exata-
mente os elementos dos elementos de a. ComoSos elementos dos elementos de
a ocorrem em nı́veis anteriores ao de a, então a ocorre no nı́vel de a (e pos-
sivelmente no nı́vel anterior). Isto é válido na estrutura cumulativa de tipos.
10
ObserveS que, pelo axioma do par, existe {a, b}; logo, pelo axioma da reunião,
existe {a, b}. É fácil provar que este conjunto é exatamente a ∪ b. Vemos
assim que o axioma da reunião finita resulta agora redundante.
S
Proposição 3.2 (1) [A1], [PR], [A4] ` {a, b} = a ∪ b. Portanto, o axioma
[RF] é deduzido dos outros axiomas introduzidos até agora.
(2) Se s ≡def {x : φ(x)} e t ≡def {x : ϕ(x)} são legitimados então
[
{s, t} = s ∪ t = {x : φ(x) ∨ ϕ(x)}.
Demonstração: (1) Por definição,

S
{a, b} = {x : (∃z)(z ∈ {a, b} ∧ x ∈ z)}
= {x : (∃z)((z = a ∨ z = b) ∧ x ∈ z)}
= {x : (∃z)((z = a ∧ x ∈ z) ∨ (z = b ∧ x ∈ z))}
= {x : x ∈ a ∨ x ∈ b}
= a ∪ b.
S
(2) Considere ψ(a, b) ≡def (∀x)(x ∈ {a, b} ↔ x ∈ a ∪ b) (lembrando que
devemos eliminar os meta-termos para obter uma fórmula). Por (1) temos
(∀a)(∀b)ψ(a, b) e então, pela Observação 2.1, deduzimos ψ(s, t), pois s e t são
legitimados.
Observe que, por [A2], sempre podemos definir a interseção de uma familia não
vazia de conjuntos:
Proposição 3.3 [A2], (∃x)(x ∈ a) ` (∃w)(∀x)(x
T ∈ w ↔ (∀y)(y ∈ a → x ∈ y)).
Em outras palavras, se a 6= ∅, então a ≡def {x : (∀y)(y ∈ a → x ∈ y)} é
legitimado.
Demonstração: Por [A2] temos que existe s = {x : x ∈ b ∧ (∀y)(y ∈
a → x ∈ y)}. Mas b ∈ a e (∀y)(y ∈ a → x ∈ y) implicam que x ∈ b, logo
s = {x : (∀y)(y ∈ a → x ∈ y)}.
Provaremos algumas propriedades básicas da interseção e a reunião arbitrária

de conjuntos. Antes disso, precissamos ampliar a nossa notação permitindo
(meta)termos da forma {t : ϕ}, onde t é um (meta)termo da forma {x : φ}.
Definimos {t : ϕ} como sendo {x : (∃u1 ) · · · (∃un )((x = t) ∧ ϕ)} onde u1 ,
. . . , un são algumas das variáveis livres comuns a t e ϕ (no contexto ficará
claro quais variáveis serão livres, funcionando como parâmetros). Por exemplo,
podemos formar o termo s ≡def {a ∩ c : c ∈ b}, com variáveis livres a e b,
a partir do termo t ≡def a ∩ c (com variáveis livres a e c). Logo, s denota o
termo {x : (∃c)((x = a ∩ c) ∧ c ∈ b)}; aqui, c e b são as variáveis livres de
ϕ(c, b) ≡def c ∈ b. É imediato que se t é legitimado, então ϕ implica t ∈ {t : ϕ}.
Proposição
S 3.4 Na TC introduzida até agora temos o seguinte:
(1) S ∅ = ∅.
(2) {a} = a. S S
(3) Se s ≡def {x : φ(x)} é legitimado, então {s} = s; em particular, {∅} =
∅.
11
S S S
(4) T(a ∪ b) = ( a) ∪ ( b).
(5) {a, b} = a ∩ b. T
(6) Se s ≡def {x : φ(x)} e t ≡def {x : ϕ(x)} são legitimados, então {s, t} =
s ∩ t. T T T T
(7) Se a 6= ∅ e b 6= ∅,TentãoSexiste (a ∪ b), e (a ∪ b) = ( a) ∩ ( b).
(8) Se a S 6= ∅, então
S a ⊆ a.
(9) a ∩ ( b) = {a ∩ c : cT∈ b}. T T
(10) Se b 6= ∅, então existe {a ∪ c : c ∈ b}, e a ∪ ( b) = {a ∪ c : c ∈ b}.
S
Demonstração: (1) x ∈ S∅ sse (∃z)(x ∈ z ∧ z ∈ ∅) see (∃z)(x ∈ z ∧ z 6= z)
sse (∃z)(zS 6= z). Logo, x 6∈ ∅ para todo x.
(2) x ∈ {a} sse (∃z)(x ∈ z ∧ z ∈ {a}) sse (∃z)(x ∈ z ∧ z = a) S sse x ∈ a.
(3) É conseqüência de (2), considerando ψ(a) ≡def (∀x)(x ∈ {a} ↔ x ∈ a), a
Observação
S 2.1, e o fato de s ser legitimado.
(4) x ∈ (a ∪ b) sse (∃z)(x ∈ z ∧ z ∈ a ∪ b) sse (∃z)(x ∈ z ∧ (z ∈ a ∨ z ∈ b)) sse
(∃z)((x ∈Sz ∧z ∈Sa)∨(x ∈ z ∧z ∈ b)) sse (∃z)(x ∈ z ∧z ∈ a)∨(∃z)(x ∈ z ∧z ∈ b)
sse x ∈ (T a) ∪ ( b) (lembre que (∃z)(φ(z) ∨ ϕ(z)) ∼ (∃z)φ(z) ∨ (∃z)ϕ(z)).
(5) x ∈ {a, b} sse (∀y)(y ∈ {a, b} → x ∈ y) sse (∀y)((y = a ∨ y = b) → x ∈ y)
sse (∀y)((y = a → x ∈ y) ∧ (y = b → x ∈ y)) sse (∀y)(y = a → x ∈ y) ∧ (∀y)(y =
b → x ∈ y) sse x ∈ a ∧ x ∈ b sse x ∈ a ∩ b (lembre que (∀y)(φ(y) ∧ ϕ(y)) ∼
(∀y)φ(y) ∧ (∀y)ϕ(y)). T
(6) Considere ψ(a, b) ≡def (∀x)(x ∈ {a, b} ↔ x ∈ x ∈ a ∩ b). Por (5),
vale (∀a)(∀b)ψ(a, b), donde deduzimos ψ(s, t) para s e t legitimados, pela Ob-
servação 2.1.
(7) A prova é similar à do item (5).
(8) É imediato.
S
(9) x ∈ {a ∩ c : c ∈ b} sse (∃z)(x ∈ z ∧ (∃c)(z = (a ∩ c) ∧ c ∈ b) sse (∃c)(x ∈
(a ∩ c) ∧ c ∈Sb) sse (∃c)((x ∈ a ∧ (x ∈ c ∧ c ∈ b)) sse x ∈ a ∧ (∃c)(x ∈ c ∧ c ∈ b)
sse x ∈ a ∩ ( b) (lembre que (∃c)(ϕ ∧ φ(c)) ∼ ϕ ∧ (∃c)φ(c) se c não ocorre livre
em ϕ). T T
(10) x ∈ a ∪ ( b) sse x ∈ a ∨ (∀c)(c ∈ b → x ∈ c). Por outro lado, x ∈ {a ∪ c :
c ∈ b} sse (∀y)(yT ∈ {a ∪ c : c ∈ b} → x ∈ y).
Seja x ∈ a ∪ ( b) e y ∈ {a ∪ c : c ∈ b}; logo, existe c0 ∈ b tal que y = a ∪ c0 .
Se x ∈ a, então x ∈ (a ∪ c0 ) = y. Se (∀c)(c ∈ b → x ∈ c), então, tomando c0
0
no lugar de T c, obtemos x ∈ c e então x ∈ y. Em todo caso, provamos T que
x ∈ a ∪ ( b) T implica y ∈ {a ∪ c : c ∈ b} → x ∈ y, donde T x ∈ a ∪ ( b)
implica x ∈ {a ∪ c : c ∈ b}. Reciprocamente, seja x ∈ {a ∪ c : c ∈ b}, e
c ∈ b. Como a ∪ c ∈ T {a ∪ c : c ∈ b}, então x ∈ a ∪ c, donde x ∈ a ∨ x ∈ c.
Desta maneira, x ∈ {a ∪ c : c ∈ b} implica T c ∈ b → (x ∈ a ∨ x ∈ c) e
então x ∈ a ∨ (c ∈ b → x ∈ c). Portanto, x ∈ {a ∪ c : c ∈ b} implica
(∀c)(x ∈ a ∨ (c ∈ b → x ∈ c)) que implica x ∈ a ∨ (∀c)(c ∈ b → x ∈ c) (lembre
que (∀c)(α ∨ β(c)) ∼ α ∨ (∀c)β(c), se c não ocorre livre em α).
Finalmente formularemos o axioma da regularidade. Este axioma, devido a Zer-

melo (1930) (existe uma versão prévia de von Neumann em 1925) é fundamental
12
para evitar situações da forma x ∈ x ou, em geral,
x1 ∈ x2 ∈ · · · ∈ xn ∈ x1 .
Além disso, este axioma evita “descensos infinitos” da forma
· · · ∈ xn ∈ xn−1 ∈ · · · ∈ x2 ∈ x1
(isto significa que a relação x ∈ y é bem fundada, como estudaremos depois).
Axioma da Regularidade:
[A5] (∃y)(y ∈ x) → (∃y)(y ∈ x ∧ (∀z)¬(z ∈ x ∧ z ∈ y))
Este é o único axioma expressando a idéia que os conjuntos ocorrem en nı́veis

ou tipos, e é precisso utilizar a teoria cumulativa de tipos para entendé-lo. Com
efeito, consideremos um conjunto x não vazio. Comecemos a analizar os nı́veis
de baixo para cima, até encontrar o primeiro nı́vel em que foram formados
elementos de x. Por exemplo, se x = {{∅}, {{∅}}, {{{∅}}}}, então o primeiro
nı́vel em que aparecem elementos de x é o nı́vel 2, assumindo que não temos
indivı́duos. Assim se y ∈ x está no nı́vel mı́nimo, então os elementos de y (se
existirem) devem necessariamente ter sido criados em nı́veis anteriores, logo não
podem pertencer a x, isto é: y ∩x = ∅ (o que se confirma no nosso exemplo). Os
axiomas de extensionalidade e regularidade são os únicos que exigem conjuntos
satisfazendo certas propriedades; os outros axiomas estabelecem a existência de
suficientes conjuntos em alguma direção.
Definição 3.5 S é o sistema axiomático da TC que consiste dos axiomas [A1]-

[A5] mais [PR].
Proposição 3.6 (1) S ` a 6∈ a.

(2) S ` ¬(a ∈ b ∧ b ∈ a).
Demonstração: (1) a ∈ a implica a ∈ {a} ∩ a. Por [A5] existe x ∈ {a} tal

que {a} ∩ x = ∅. Mas x ∈ {a} sse x = a e então {a} ∩ a = ∅, o que contradiz
a ∈ {a} ∩ a.
(2) Se a ∈ b ∧ b ∈ a, então a ∈ {a, b} ∩ b e b ∈ {a, b} ∩ a. Por [A5] existe
x ∈ {a, b} tal que {a, b} ∩ x = ∅. Mas x ∈ {a, b} sse x = a ou x = b. Os dois
casos levam a uma contradição.
A partir de agora, desenvolveremos um estudo da TC obtida através do sis-
tema S. O sistema completo ZF da TC será introduzido na Seção 11. Porém, é
importante observar que uma parte interessante da TC “finita” pode ser desen-
volvida utilizando apenas o sub-sistema S de ZF , como veremos nas próximas
seções.
4 Produtos Cartesianos
Estamos em condições de começar a desenvolver as primeiras aplicações do
fragmento S de ZF introducido até agora. Antes de estudar a teoria de relações
13
e funções na próxima seção, é necessário definir o conceito de par ordenado, a
partir do qual são introduzidos os produtos cartesianos de conjuntos.
Definição 4.1 (Kuratowski) (i) ha, bi ≡def {{a}, {a, b}}.

(ii) ha1 , . . . , an+1 i ≡def hha1 , . . . , an i, an+1 i para n ≥ 2.
É claro que o axioma [PR] assegura a existência de ha, bi para todo a e b. Ob-
serve que a definição de ha, b, ci como sendo {{a}, {a, b}, {a, b, c}} não funciona
(porqué?).
Proposição 4.2 S ` ha, bi = hc, di ↔ (a = c) ∧ (b = d).
Demonstração: x ∈ ha, bi sse x = {a} ou x = {a, b}, e x ∈ hc, di sse x = {c}

ou x = {c, d}. Suponha que ha, bi = hc, di; a prova de que a = c e b = d será
feita por análise de casos.
Caso 1: a = b. Logo, ha, bi = {{a}} = {{c}, {c, d}} e então, pelo Corolário 2.4,
{c} = {a} = {c, d} donde, usando novamente o Corolário 2.4, obtemos que
c = a = d.
Caso 2: a 6= b. Dado que {a} ∈ hc, di, então {a} = {c} ou {a} = {c, d} (usando
o Corolário 2.4).
Caso 2.a: {a} = {c}. Logo a = c, e então hc, di = {{a}, {a, d}}. Como
{a, b} ∈ hc, di e {a, b} 6= {a} (pelo Corolário 2.4 e a hipótese a 6= b), então
{a, b} = {a, d}. Daqui obtemos, de a 6= b, que b = d.
Caso 2.b: {a} = {c, d}. Logo c = a = d e então hc, di = {{a}}. Mas
{a, b} ∈ hc, di, donde {a, b} = {a}, e então a = b, o que contradiz a hipótese
a 6= b. Daqui inferimos que vale o caso 2.a.
Claramente, a = c, b = d implica ha, bi = hc, di, pelas regras da igualdade.
Uma vez que possuimos a definição de par ordenado, podemos criar o con-
junto de todos os pares ordenados hx, yi, onde x ∈ a e y ∈ b, fixados a e b.
Definição 4.3 O produto cartesiano de a e b é dado por a × b ≡def {hx, yi :

x ∈ a ∧ y ∈ b}.
Provaremos agora que o termo a × b é legitimado.
Proposição 4.4 a × b = {x : x ∈ P(P(a ∪ b)) ∧ (∃y)(∃z)(x = hy, zi ∧ (y ∈

a) ∧ (z ∈ b))}. Portanto, a × b é legitimado por [A2] (dado que os termos
envolvidos na definição são legitimados pelos outros axiomas de S).
Demonstração: Temos que {x : x ∈ P(P(a ∪ b)) ∧ (∃y)(∃z)(x = hy, zi ∧ (y ∈

a) ∧ (z ∈ b))} é legitimado por [A2]. Provaremos em S que
(∃y)(∃z)(x = hy, zi ∧ (y ∈ a) ∧ (z ∈ b)) →
→ x ∈ P(P(a ∪ b)) ∧ (∃y)(∃z)(x = hy, zi ∧ (y ∈ a) ∧ (z ∈ b))
e então (dado que a implicação recı́proca é sempre verdadeira) teremos provado
o resultado. Seja então x = hy, zi tal que y ∈ a, z ∈ b. Portanto, {y} ⊆ a ∪ b
e {y, z} ⊆ a ∪ b, donde {y} ∈ P(a ∪ b) e {y, z} ∈ P(a ∪ b). Desta maneira,
x = {{y}, {y, z}} ⊆ P(a ∪ b) e então x ∈ P(P(a ∪ b)).
14
Proposição 4.5 S ` a × b = ∅ ↔ a = ∅ ∨ b = ∅.
Demonstração: Suponha que a × b = ∅. Assuma que ¬(a = ∅ ∨ b = ∅), isto
é, a 6= ∅ e b 6= ∅. Logo, (∃y)(y ∈ a) e (∃z)(z ∈ b). Daqui hy, zi ∈ a × b, uma
contradição. Portanto, inferimos que a = ∅ ∨ b = ∅. Reciprocamente, suponha
que a = ∅ ∨ b = ∅; logo, ¬(∃y)(y ∈ a) ∨ ¬(∃z)(z ∈ b) e então ¬(∃y)(∃z)((y ∈
a) ∧ (z ∈ b) ∧ x = hy, zi) para todo x. Portanto, x 6∈ a × b para todo x, donde
a × b = ∅.
Proposição 4.6 S ` a × b = b × a ↔ (a = ∅ ∨ b = ∅ ∨ a = b).

Demonstração: Suponha que a × b = b × a; assumindo a 6= ∅, b 6= ∅ e a 6= b
provaremos uma contradição. Com efeito, de a 6= b inferimos que existe x ∈ a,
x 6∈ b ou existe x ∈ b, x 6∈ a, por [A1]. Assumamos x ∈ a, x 6∈ b (o raciocı́nio
para a outra possibilidade é simétrico). Seja y ∈ b (assumimos b 6= ∅). Portanto,
hx, yi ∈ a × b = b × a, e então (x ∈ b) ∧ (y ∈ a), donde x ∈ b, uma contradição.
Reciprocamente, suponha que (a = ∅∨b = ∅∨a = b). Temos que (a = ∅∨b = ∅)
implica a × b = ∅ = b × a, pela Proposição 4.5. Por outro lado, a = b implica
a × b = b × a, pelas regras da igualdade.
Proposição 4.7 (i) S ` (a 6= ∅ ∧ a × b ⊆ a × c) → (b ⊆ c).

(ii) S ` (b ⊆ c) → (a × b ⊆ a × c).
Demonstração: (i) O caso b = ∅ é trivial. Assuma então b 6= ∅ e seja y ∈ b.
Fixe x ∈ a (assumimos a 6= ∅); logo hx, yi ∈ a × b, e a × b ⊆ a × c, donde
hx, yi ∈ a × c. Daqui (x ∈ a) ∧ (y ∈ c), e então y ∈ c; isto é, b ⊆ c.
(ii) O caso a × b = ∅ é trivial. Seja z ∈ a × b; logo, z = hx, yi para x ∈ a e y ∈ b.
Mas b ⊆ c, donde y ∈ c e então z = hx, yi ∈ a × c. Portanto a × b ⊆ a × c.
Proposição 4.8 (i) S ` a × (b ∩ c) = (a × b) ∩ (a × c).

(ii) S ` a × (b ∪ c) = (a × b) ∪ (a × c).
(iii) S ` a × (b − c) = (a × b) − (a × c).
Demonstração: (i) hx, yi ∈ a × (b ∩ c) sse (x ∈ a) ∧ (y ∈ (b ∩ c)) sse (x ∈
a) ∧ ((y ∈ b) ∧ (y ∈ c)) sse ((x ∈ a) ∧ (y ∈ b)) ∧ ((x ∈ a) ∧ (y ∈ c)) sse
(hx, yi ∈ a × b) ∧ (hx, yi ∈ a × c) sse hx, yi ∈ (a × b) ∩ (a × c).
(ii), (iii): São deixados como exercı́cio.
Proposição 4.9 S ` (a ⊆ a × a) → a = ∅.
Demonstração: Se z ∈ a então, de a ⊆ a × a, inferimos
z = {{x}, {x, y}} ∈ a × a para algum x, y ∈ a. (∗)
S
Suponha então S a 6= ∅. Pelo axioma deS regularidade aplicado a a ∪ ( a) 6= ∅,
existeSc ∈ a ∪ ( a) tal que c ∩ (a ∪ ( a)) = ∅. Observe que os elementos de
a ∪ (S a) são conjuntos não vazios, por (∗). Daqui, c 6= ∅. SSe c ∈ a, então
c ⊆ a (isto é uma conseqüência imediata
S da definição de a, e S é deixado
S Daqui ∅ =
como exercı́cio). 6 c = c ∩ ( a), o que contradiz c ∩ (a ∪ ( a)) = ∅.
Portanto c ∈ a donde, por (∗), teremos que c = {x} ou c = {x, y} para
x, y ∈ a. Nos dois casos c ∩ a 6= ∅, uma contradição.
15
5 Relações em S
Nesta seção trataremos a teoria elementar de relações em S, utilizando os re-
sultados sobre produtos cartesianos provados na seção anterior.
Definição 5.1 Introduzimos as notações seguintes:
rel(r) para (∀x)(x ∈ r → (∃y)(∃z)(x = hy, zi))
“r é uma relação (um conjunto de pares ordenados)”;
u r v para hu, vi ∈ r
“u está em relação r com v”;
dom(r) para {x : (∃y)(x r y)}
(o domı́nio de r);
im(r) para {y : (∃x)(x r y)}
(a imagem de r);
r|z para {u : u ∈ r ∧ (∃x)(∃y)(u = hx, yi ∧ x ∈ z)}
(r com domı́nio restrito a z);
−1
r para {u : (∃x)(∃y)(u = hx, yi ∧ y r x)}
(a relação inversa de r);
r“z para {y : (∃x)(x ∈ z ∧ x r y)}, isto é, im(r|z)
(a imagem de z por r);
r(z) para {y : (∃u)((∀w)(z r w ↔ w = u) ∧ y ∈ u)}
(o único valor de r em z, se existir, ou ∅ em caso contrário).
Proposição 5.2 (a) (rel(r) ∧ (s ⊆ r)) → rel(s); em particular, rel(∅).

(b) (rel(r) ∧ rel(s)) → rel(r ∪ s) ∧ rel(r ∩ s) ∧ rel(r − s).
Demonstração: (a) z ∈ s implica z ∈ r implica z = hx, yi para algum x e y;

logo, rel(s).
(b) z ∈ r ∪ s implica z ∈ r ou z ∈ s; nos dois casos, z = hx, yi para algum x, y.
Os outros casos são similares.
Proposição 5.3 Os meta-termos da Definição 5.1 são legitimados.

SS
Demonstração: dom(r): Por S [A2],
S existe {x : x ∈ r ∧ (∃y)(x r y)}.
Provaremos que a condição x ∈ r pode ser eliminada. Com efeito, suponha
S
que (∃y)(xSrSy). Logo hx, yi ∈ r, isto é, {{x}, {x, y}} ∈ r. Daqui {x} ∈ r e
então x ∈ r.
im(r): A prova é análoga à anterior.
r|z: É legitimado por [A2].
r−1 : Por [A2] existe {u : u ∈ im(r) × dom(r) ∧ (∃x)(∃y)(u = hx, yi ∧ y r x)}.
Provaremos que a condição u ∈ im(r)×dom(r) é implicada pela outra condição.
Seja então u satisfazendo: (∃x)(∃y)(u = hx, yi ∧ y r x). Logo, u = hx, yi tal
que y r x, donde y ∈ dom(r) e x ∈ im(r), e então u = hx, yi ∈ im(r) × dom(r).
r“z: Temos que r“z = im(r|z), S sendo portanto legitimado.
r(z): Por [A2], existe {y : y ∈ im(r) ∧ (∃u)((∀w)(z r S w ↔ w = u) ∧ y ∈ u)}.
Como antes, veremos que a condição de separação y ∈ im(r) é redundante.
Com efeito, suponha que y satisfaz (∃u)((∀w)(z r w ↔ w = u) ∧ y ∈ u), e seja
16
u satisfazendo (∀w)(z r w ↔ w = u) ∧ y ∈ u. Tomando
S w = u obtemos que z
r u, donde u ∈ im(r). Mas y ∈ u, portanto y ∈ im(r).
Proposição 5.4 (a) dom(r ∪ s) = dom(r) ∪ dom(s).

(b) dom(r ∩ s) ⊆ dom(r) ∩ dom(s).
(c) dom(r) − dom(s) ⊆ dom(r − s).
(d) im(r ∪ s) = im(r) ∪ im(s).
(e) im(r ∩ s) ⊆ im(r) ∩ im(s).
(f ) im(r) − im(s) ⊆ im(r − s).
Demonstração: (a) Temos que x ∈ dom(r ∪ s) sse (∃y)(x (r ∪ s) y) sse (∃y)((x

r y) ∨ (x s y)) sse (∃y)(x r y) ∨ (∃y)(x s y) sse x ∈ dom(r) ∨ x ∈ dom(s) sse
x ∈ dom(r) ∪ dom(s).
(b)-(f): As provas são análogas, e são deixadas como exercı́cio.
Com relação a r−1 temos as seguintes propriedades:
Proposição 5.5 (a) (r−1 )−1 ⊆ r; rel(r) → r ⊆ (r−1 )−1 .

(b) (r ∪ s)−1 = r−1 ∪ s−1 .
(c) (r ∩ s)−1 = r−1 ∩ s−1 .
(d) (r − s)−1 = r−1 − s−1 .
Demonstração: (a) z ∈ (r−1 )−1 implica que z = hx, yi tal que x (r−1 )−1
y. Mas x (r−1 )−1 y implica y r−1 x implica x r y, isto é, z = hx, yi ∈ r.
Reciprocamente, se rel(r), seja z ∈ r; então z = hx, yi tal que x r y, e a prova
é como acima, revertendo as implicações.
(b) hx, yi ∈ (r ∪ s)−1 sse hy, xi ∈ r ∪ s sse (hy, xi ∈ r) ∨ (hy, xi ∈ s) sse
hx, yi ∈ r−1 ∨ hx, yi ∈ s−1 see hx, yi ∈ r−1 ∪ s−1 .
(c) Análoga à prova anterior.
(d) hx, yi ∈ (r − s)−1 sse hy, xi ∈ r − s sse (hy, xi ∈ r) ∧ (hy, xi 6∈ s) sse
hx, yi ∈ r−1 ∧ hx, yi 6∈ s−1 see hx, yi ∈ r−1 − s−1 .
Definição 5.6 A composição de r e s é definida como
r ◦ s ≡def {hx, yi : (∃z)((x r z) ∧ (z s y))}.
Proposição 5.7 r ◦ s é legitimado em S.
Demonstração: Provaremos que
r ◦ s = {u : u ∈ dom(r) × im(s) ∧ (∃x)(∃y)(∃z)((u = hx, yi) ∧ (x r z) ∧ (z s y))},
donde o resultado segue por [A2]. Assim, suponha que u = hx, yi tal que x
r z, z s y para algum z. Logo x ∈ dom(r) e y ∈ im(s), donde u = hx, yi ∈
dom(r) × im(s).
A composição satisfaz as seguintes propriedades:
17
Proposição 5.8 (a) r ◦ (s ∪ t) = (r ◦ s) ∪ (r ◦ t).
(b) r ◦ (s ∩ t) ⊆ (r ◦ s) ∩ (r ◦ t).
(c) (r ◦ s) − (r ◦ t) ⊆ r ◦ (s − t).
(d) (r ◦ s)−1 = s−1 ◦ r−1 .
(e) r ◦ (s ◦ t) = (r ◦ s) ◦ t
Demonstração: (a) Temos que
x (r ◦ (s ∪ t)) y
see (∃z)((x r z) ∧ (z (s ∪ t) y))
see (∃z)((x r z) ∧ ((z s y) ∨ (z t y)))
see (∃z)(((x r z) ∧ (z s y)) ∨ ((x r z) ∧ (z t y)))
see (∃z)((x r z) ∧ (z s y)) ∨ (∃z)((x r z) ∧ (z t y))
see (x (r ◦ s) y) ∨ (x (r ◦ t) y)
see x ((r ◦ s) ∪ (r ◦ t)) y.
(b) Temos que
x (r ◦ (s ∩ t)) y
implica (∃z)((x r z) ∧ (z (s ∩ t) y))
implica (∃z)((x r z) ∧ ((z s y) ∧ (z t y)))
implica (∃z)(((x r z) ∧ (z s y)) ∧ ((x r z) ∧ (z t y)))
implica (∃z)((x r z) ∧ (z s y)) ∧ (∃z)((x r z) ∧ (z t y))
implica (x (r ◦ s) y) ∧ (x (r ◦ t) y)
implica x ((r ◦ s) ∩ (r ◦ t)) y,
lembrando que (∃z)(φ ∧ ψ) → ((∃z)φ ∧ (∃z)ψ). A recı́proca desta propriedade

lógica não é verdadeira em geral, donde não vale em geral a igualdade em (b).
(c) A prova é análoga à anterior.
(d) x (r ◦ s)−1 y sse y (r ◦ s) x sse (∃z)((y r z) ∧ (z s x)) sse (∃z)((z r−1 y) ∧ (x
s−1 z)) sse x (s−1 ◦ r−1 ) y.
(e) É deixada como exercı́cio.
A restrição satisfaz as seguintes propriedades:
Proposição 5.9 (a) r|z = r ∩ (z × im(r)).

(b) r|(a ∩ b) = (r|a) ∩ (r|b).
(c) r|(a ∪ b) = (r|a) ∪ (r|b).
(d) r|(a − b) = (r|a) − (r|b).
(e) (r ◦ s)|a = (r|a) ◦ s.
Demonstração: Exercı́cio.
Finalmente, a imagem r“z satisfaz as seguintes propriedades:
Proposição 5.10 (a) r“(a ∪ b) = r“a ∪ r“b.

(b) r“(a ∩ b) ⊆ r“a ∩ r“b.
18
(c) r“a − r“b ⊆ r“(a − b).
(d) (a ⊆ b) → (r“a ⊆ r“b).
(e) (r“a = ∅) ↔ (dom(r) ∩ a = ∅).
Demonstração: (a) Temos que

y ∈ r“(a ∪ b)
sse (∃x)((x r y) ∧ (x ∈ a ∪ b))
sse (∃x)((x r y) ∧ (x ∈ a)) ∨ (∃x)((x r y) ∧ (x ∈ b))
sse (y ∈ r“a) ∨ (y ∈ r“b)
sse y ∈ (r“a ∪ r“b).
(b) A prova é análoga, usando agora (∃x)(φ ∧ ψ) → ((∃x)φ ∧ (∃x)ψ).
(c) Análoga à anterior.
(d) y ∈ r“a implica (∃x)((x r y) ∧ (x ∈ a)) implica (∃x)((x r y) ∧ (x ∈ b))
implica y ∈ r“b.
(e) y ∈ r“a implica (∃x)((x r y) ∧ (x ∈ a)). Portanto, se (x r y) ∧ (x ∈ a), então
x ∈ dom(r) ∩ a. Isto é, r“a 6= ∅ implica dom(r) ∩ a 6= ∅. Reciprocamente, se
x ∈ dom(r)∩a, então x r y para algum y, e x ∈ a, donde (∃x)((x r y)∧(x ∈ a)).
Portanto y ∈ r“a, isto é: dom(r) ∩ a 6= ∅ implica r“a 6= ∅.
Exemplo 5.11 Assumindo os números naturais como indivı́duos, sejam
r = {h1, 2i, h1, 3i, h2, 1i, h2, 3i}, s = {h2, 1i, h3, 5i}.
Portanto,
dom(r) = {1, 2}, im(r) = {1, 2, 3},

r“({1}) = {2, 3}, r“({3}) = ∅,
s−1 = {h1, 2i, h5, 3i}, r ◦ s = {h1, 1i, h1, 5i, h2, 5i},
s ◦ r = {h2, 2i, h2, 3i}, r|{2} = {h2, 1i, h2, 3i},
im(r|{2}) = {1, 3} = r“{2}, (r−1 )“{3} = {1, 2}.
6 Relações de Ordem
Um tipo muito importante de relações é a classe das relações de ordem. Elas
ocorrem em quase todas as áreas da matemática, sendo que o seu estudo cons-
titui, em si, uma área relevante dentro da Matemática.
Definição 6.1 Introduzimos as notações seguintes:

ref (r, a) para (∀x)(x ∈ a → (x r x))
(r é reflexiva em a);
irr(r, a) para (∀x)(x ∈ a → ¬(x r x))
(r é irreflexiva em a);
sim(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a) ∧ (x r y)) → (y r x))
(r é simétrica em a);
asim(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a) ∧ (x r y)) → ¬(y r x))
(r é asimétrica em a);
19
anti(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a) ∧ (x r y) ∧ (y r x)) → (x = y));
(r é antisimétrica em a);
tran(r, a) para
(∀x)(∀y)(∀z)(((x ∈ a) ∧ (y ∈ a) ∧ (z ∈ a) ∧ (x r y) ∧ (y r z)) → (x r z))
(r é transitiva em a);
con(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a) ∧ (x 6= y)) → ((x r y) ∨ (y r x)))
(r é conectada em a);
f con(r, a) para (∀x)(∀y)(((x ∈ a) ∧ (y ∈ a)) → ((x r y) ∨ (y r x)))
(r é fortemente conectada em a).
As definições usuais (r é reflexiva, r é simétrica, etc.) são obtidas considerando

a = dom(r)∪im(r) ≡def F (r); assim, ref (r) denota ref (r, F (r)), sim(r) denota
sim(r, F (r)), etc. Será muito útil definir a relação identidade sobre um conjunto
a, dada pelo termo I(a) = {hx, xi : x ∈ a}.
Proposição 6.2 O termo I(a) é legitimado em S.
Demonstração: O termo s ≡def {z : z ∈ PP(a) ∧ (∃x)(z = hx, xi ∧ (x ∈ a))}

é legitimado por [A2]. Basta então provar que (∃x)(z = hx, xi∧(x ∈ a)) implica
z ∈ PP(a). Com efeito, z = hx, xi implica z = {{x}}. Por outro lado, x ∈ a
implica {x} ∈ P(a), portanto z ⊆ P(a), isto é, z ∈ PP(a). Logo I(a) = s,
sendo portanto legitimado.
Proposição 6.3 Seja r uma relação. As seguintes propriedades são demons-

tráveis em S:
(a) asim(r) → irr(r).
(b) asim(r) → anti(r).
(c) (sim(r) ∧ tran(r)) → ref (r).
Demonstração: (a) Seja x ∈ F (r); como r é asimétrica, então (x r x) implica

¬(x r x), donde obtemos ¬(x r x).
(b) Sejam x, y ∈ F (r) tais que (x r y)∧(y r x). Logo, obtemos ¬(y r x), pois r é
asimétrica, donde deduzimos uma contradição. Portanto (x, y ∈ F (r))∧asim(r)
implica ¬((x r y) ∧ (y r x)), e a posteriori ¬((x r y) ∧ (y r x)) ∨ (x = y), isto
é, ((x r y) ∧ (y r x)) → (x = y).
(c) Suponha que x ∈ F (r). Se x ∈ dom(r), então x r y para algum y ∈ F (r).
Como sim(r), então y r x, donde (x r y) ∧ (y r x). Portanto x r x, pois tran(r).
Por outro lado, se x ∈ im(r), então y r x para algum y ∈ F (r), e a prova é
análoga.
Podemos definir cinco tipos de ordens:
Definição 6.4 Sejam r uma relação e a um conjunto. Definimos o seguinte:

(a) qo(r, a) denota ref (r, a) ∧ tran(r, a) (r é uma quase ordem em a).
(b) op(r, a) denota ref (r, a) ∧ anti(r, a) ∧ tran(r, a) (r é uma ordem parcial em
a).
(c) os(r, a) denota anti(r, a) ∧ tran(r, a) ∧ f con(r, a) (r é uma ordem simples
em a).
20
(d) ope(r, a) denota asim(r, a) ∧ tran(r, a) (r é uma ordem parcial estrita em
a).
(e) ose(r, a) denota asim(r, a) ∧ tran(r, a) ∧ con(r, a) (r é uma ordem simples
estrita em a).
(f ) qo(r) denota qo(r, F (r)), etc.
Se r satisfaz alguma das definições de ordem introduzidas na Definição 6.4,

então escreveremos x ≤ y ou ainda x < y (se r é irreflexiva) no lugar de x r y,
quando não existir risco de confusão.
Exemplos 6.5 (1) Dado um conjunto b, então a = P(b) é parcialmente orde-

nado pela relação x ≤ y sse x ⊆ y ⊆ b. Com efeito, ≤ é parcial, pois nem todo
par de subconjuntos x, y de b deve ser necessariamente comparável pela relação
de inclusão.
(2) O conjunto N dos números naturais é ordenado pela relação: n ≤ m sse n|m
(n divide a m). Com efeito, n ≤ n para todo n, pois n = 1.n, donde n|n. Por
outro lado, n|m e m|n significa: existem k, h em N tais que m = kn, n = hm,
portanto m = k(hm) = (kh)m. Se m = 0, então n = h.0 = 0 = m. Se m 6= 0,
então de m = (kh)m inferimos 1 = kh, e então k = 1 = h, donde n = m.
Finalmente, se n ≤ m e m ≤ r, então m = kn e r = hm para certos k, h ∈ N.
Portanto r = hm = h(kn) = (hk)n para hk ∈ N donde n|r, isto é, n ≤ r.
Observe que 1|n para todo n, pois n = n.1; logo 1 ≤ n para todo n, isto é, 1 é
o mı́nimo elemento de N com a ordem divide a. Por outro lado, 0 = 0.n para
todo n, e então n|0 para todo n, isto é, n ≤ 0 para todo n. Daqui 0 é o máximo
elemento de N com a ordem divide a. Observe que a ordem não é conectada:
2 6≤ 3 e 3 6≤ 2, pois 2 e 3 são co-primos. Os números primos positivos são
os elementos minimais, isto é, se n ≤ p e p é primo, então n = 1 (o mı́nimo
elemento com relação a ≤ ) ou n = p. Reciprocamente, se p é minimal, então
p deve ser necessariamente primo.
Proposição 6.6 Em S temos o seguinte:

(a) op(r) → qo(r).
(b) os(r) → op(r).
(c) os(r) → os(r−1 ).
(d) qo(r) ∧ qo(s) → qo(r ∩ s).
Demonstração: (a) Imediato das definições.

(b) Só falta provar a reflexividade da r. Mas x ∈ F (r) implica ((x r x) ∨ (x r
x)), isto é, x r x, pois f con(r).
(c) É claro que tran(r) → tran(r−1 ). Com efeito, ((x r−1 y)∧(y r−1 z)) implica
((y r x) ∧ (z r y)) implica z r x (pois tran(r)) implica x r−1 z. Da mesma
maneira provamos que anti(r) → anti(r−1 ) e f con(r) → f con(r−1 ).
(d) Seja x ∈ F (r ∩ s), logo x ∈ F (r) ∩ F (s), donde ((x r x) ∧ (x s x)), pois
ref (r) ∧ ref (s). Portanto x (r ∩ s) x, isto é, ref (r ∩ s). Suponha agora que ((x
(r ∩ s) y) ∧ (y (r ∩ s) z)). Daqui obtemos ((x r y) ∧ (y r z)), donde x r z, pois
tran(r). Analogamente x s z, e então x (r ∩ s) z; isto é, tran(r ∩ s).
21
Observe que a reunião de duas quase-ordens não resulta necessariamente numa
quase-ordem. Por exemplo
r = {h1, 1i, h2, 2i, h1, 2i}, s = {h2, 2i, h3, 3i, h2, 3i}
são duas quase-ordens, mas a união, embora reflexiva, não é transitiva. A

situação muda se F (r) ∩ F (s) = ∅.
Proposição 6.7 S ` (qo(r) ∧ qo(s) ∧ (F (r) ∩ F (s) = ∅)) → qo(r ∪ s).
Demonstração: É claro que r ∪ s é reflexiva. Suponha que ((x (r ∪ s) y) ∧ (y
(r ∪ s) z)). Como F (r) ∩ F (s) = ∅, então só vale uma das seguintes afirmações:
((x r y) ∧ (y r z)), ((x s y) ∧ (y s z)).
Nos dois casos, obtemos x (r ∪ s) z, pois tran(r) ∧ tran(s).
Proposição 6.8 S ` ((r ⊆ s) ∧ (s ⊆ (a × a)) ∧ ose(r, a) ∧ ose(s, a)) → (r = s).
Demonstração: Suponha que x s y mas ¬(x r y). Como asim(s), então

x 6= y, donde y r x, pois con(r, a). Portanto y s x, pois r ⊆ s, o que contradiz
asim(s).
O significado da proposição precedente é o seguinte: uma ordem simples estrita

em a ordena todos os elementos de a numa ordem estrita, isto é: x 6< x para
todo x ∈ a. Portanto, se r, s são duas ordens estritas simples em a tal que s
estende r, então elas devem necessariamente coincidir, pois r já ordenou todos
os elementos de a.
Introduziremos agora a importante noção de boa ordem. Uma boa ordem
em a é uma ordem simples estrita r tal que todo subconjunto não vazio de a
tem um elemento mı́nimo segundo r. De fato, a conectividade de r implicará a
transitividade e asimetria de r. Antes da definição, analizaremos alguns exem-
plos.
Exemplos 6.9 (a) O conjunto N dos números naturais é bem ordenado pela
relação < usual (menor que). De fato, ∅ =
6 A ⊆ N possui um elemento mı́nimo.
(b) N não é bem ordenado pela ordem simples estrita > (maior que). Com
efeito, ∅ =6 A ⊆ N tem elemento mı́nimo com relação a > significa que existe
n ∈ A tal que n > m para todo m ∈ A. Em particular, o próprio N deveria ter
um primeiro elemento relativo a >, isto é, deveria existir n ∈ N tal que n > m
para todo m ∈ N; mas isto não é verdade (n 6> n + 1).
(c) Considere A = {(n − 1)/n : n ∈ N ∧ n 6= 0} ∪ {1} ordenado pela relação
< usual (em Q, o conjunto dos números racionais). Logo, A é bem ordenado.
Com efeito,
(n − 1)/n < (m − 1)/m sse m(n − 1) < n(m − 1) sse
mn − m < nm − n sse − m < −n sse n < m.
22
Portanto, ∅ 6= B ⊆ A tem primeiro elemento (n − 1)/n, onde n é o mı́nimo m
tal que (m − 1)/m ∈ B. Se B = {1}, então claramente 1 é o primeiro elemento
de B.
(d) Seja A como no item (c). Logo, > (a ordem maior que de Q) não é uma
boa ordem em A, pois B = A − {1} não tem primeiro elemento. Com efeito,
se x = (n − 1)/n fosse mı́nimo, então (n − 1)/n > n/(n + 1) donde n > n + 1,
uma contradição.
Definição 6.10 Definimos o seguinte:

(a) min(x, r, a) denota x ∈ a ∧ (∀y)(y ∈ a → ¬(y r x)) (x é um elemento
r-minimal de a).
(b) pe(x, r, a) denota x ∈ a ∧ (∀y)((y ∈ a ∧ x 6= y) → x r y) (x é um r-primeiro
elemento de a).
(c) bo(r, a) denota con(r, a) ∧ (∀b)((b ⊆ a ∧ b 6= ∅) → (∃x)min(x, r, b)) (r é uma
boa ordem em a).
Observação 6.11 Um elemento minimal não tem antecessores, enquanto que

um primeiro elemento precede todo outro elemento diferente dele mesmo. Se r
é asimétrica, então todo primeiro elemento é minimal. Com efeito, seja x ∈ a
primeiro elemento de r. Se y ∈ a, então ¬(y r x) se y = x, pois r é irreflexiva.
Se y 6= x, então x r y, pois x é primeiro elemento. Logo ¬(y r x), pois r é
asimétrica, e então x é minimal. Observe que r = {h1, 1i} em a = {1} tem
trivialmente 1 como primeiro elemento, mas 1 não é minimal, pois 1 r 1; vemos
que a hipótese de asimetria é fundamental. A recı́proca não vale em geral: 1
é minimal em r = {h1, 2i} sobre a = {1, 2, 3}, mas 1 não é primeiro elemento,
pois ¬(1 r 3). Se r é conectada e asimétrica, as duas noções coincidem. Com
efeito, se x é minimal e y 6= x, então ¬(y r x), pois x é minimal. Mas r é
conectada, portanto x r y. Daqui x é primeiro elemento.
Proposição 6.12 S ` bo(r, a) → (asim(r, a) ∧ tran(r, a)).
Demonstração: Sejam x, y ∈ a tais que x r y, y r x. Logo, {x, y} não tem

elemento minimal. Com efeito, y não é minimal, pois x r y. Analogamente,
y r x implica que x não é minimal; isto contraria o fato de r ser uma boa
ordem. Portanto, r deve ser asimétrica. Sejam agora x, y, z ∈ a tais que x r
y, y r z, ¬(x r z). Como r é asimétrica, então x 6= z. Logo, z r x, pois r é
conectada. Mas então {x, y, z} não tem elemento minimal: x r y implica que y
não é minimal; y r z implica que z não é minimal. Finalmente, z r x implica
que x não pode ser minimal. Daqui, inferimos que r é transitiva.
Proposição 6.13
(a) ` bo(r, a) ↔ (asim(r, a) ∧ con(r, a) ∧ (∀b)(b 6= ∅ ∧ b ⊆ a → (∃x)pe(x, r, b))).
(b) ` bo(r, a) ∧ a 6= ∅ → (∃!x)pe(x, r, a). Aqui, a notação (∃!x)ϕ(x) indica:
(∃x)(ϕ(x) ∧ (∀y)(ϕ(y) → (y = x))) (“existe um único x tal que ϕ(x)”).
(c) ` bo(r, a) ∧ b ⊆ a → bo(r, b).
23
Demonstração: (a) Assuma bo(r, a); pela Proposição 6.12, obtemos asim(r, a).
Claro que con(r, a), pela definição de boa ordem. Se ∅ = 6 b ⊆ a, então existe
x ∈ b tal que min(x, r, b). Pela Observação 6.11, pe(x, r, b). Reciprocamente,
suponha que (∀b)(b 6= ∅ ∧ b ⊆ a → (∃x)pe(x, r, b)), asim(r, a) e con(r, a). Logo,
con(r, a). Dado ∅ =6 b ⊆ a, seja x ∈ b tal que pe(x, r, b). Pela Observação 6.11
obtemos min(x, r, b), pois asim(r, a).
(b) Se ∅ =6 a, então, de a ⊆ a, obtemos (∃x)pe(x, r, a), pelo item (a). Sejam
x, y ∈ a tais que pe(x, r, a), pe(y, r, a). Se x 6= y, então x r y, y r x. Mas
asim(r, a), pela Proposição 6.12. Logo x = y.
(c) Suponha que bo(r, a) e b ⊆ a. É claro que con(r, b). Se ∅ 6= c ⊆ b, então
∅=6 c ⊆ a, donde min(x, r, c) para algum x ∈ c. Portanto bo(r, b).
Definição 6.14 si(y, x, r) denota (x r y) ∧ (∀z)((x r z) → (z = y ∨ (y r z)))

(“y é um r-sucessor imediato de x”).
ue(x, r, a) denota (x ∈ a) ∧ (∀y)(((y ∈ a) ∧ y 6= x) → y r x) (“x é um r-último
elemento de a”).
Proposição 6.15 S ` pe(x, r, a) ↔ ue(x, r−1 , a).
Demonstração: Imediata.
Proposição 6.16 S ` (bo(r, a) ∧ (F (r) ⊆ a) ∧ (x ∈ a) ∧ ¬ue(x, r, a))

→ (∃!y)si(y, x, r).
Demonstração: Por [A2] podemos formar b = {y : y ∈ F (r)∧(x r y)}. Dado

que F (r) ⊆ a, então obtemos que b = {y : x r y} ⊆ a. Pela Proposição 6.13(c),
temos que bo(r, b). Como x não é um último r-elemento de a, então b 6= ∅.
Portanto, existe um único r-primeiro elemento y de b, pela Proposição 6.13(b).
Temos que x r y, pois y ∈ b. Por outro lado, se (x r z) e z 6= y, então y r z, pela
definição de b e a definição de primeiro elemento. Portanto, y é um r-sucessor
imediato de x. Por outro lado, z é um r-sucessor imediato de x sse z é um
primeiro elemento de b. Portanto, y é único.
7 Relações de Equivalência
As relações de equivalência são utilizadas com frequência na Matemática. São
relações reflexivas, simétricas e transitivas. Dois exemplos básicos são a relação
de identidade e a relação de paralelismo entre retas. Como veremos depois,
uma relação de equivalência num conjunto a classifica os seus elementos de
acordo com algum critério. Esta é uma ferramenta muito útil nas construções
matemáticas, pois permite simplificar os domı́nios, analizando as classes dos
objetos no lugar dos próprios objetos. Os objetos pertencentes a uma mesma
classe são considerados idênticos.
Definição 7.1 equiv(r) denota rel(r) ∧ ref (r) ∧ sim(r) ∧ tran(r) (“r é uma
relação de equivalência”).
equiv(r, a) denota a = F (r) ∧ equiv(r) (“r é uma relação de equivalência em
a”).
24
Proposição 7.2 (a) S ` equiv(r) → (r ◦ r−1 = r).
(b) S ` qo(r) → equiv(r−1 ∩ r).
Demonstração: (a) Se x (r ◦ r−1 ) y então existe z tal que x r z, z r−1 y.

Daqui obtemos y r z e então z r y, pois sim(r), donde x r y, pois tran(r). Isto
é, r ◦ r−1 ⊆ r. Por outro lado, x r y implica (x r y) ∧ (y r−1 y), donde x (r ◦ r−1 )
y. Portanto r = r ◦ r−1 .
(b) É imediato que r−1 ∩ r = {hx, yi : (x r y) ∧ (y r x)}. Daqui o resultado é
trivial.
Definição 7.3 r[x] = {y : x r y}.
Dado que r[x] = {y : y ∈ F (r) ∧ (x r y)}, então r[x] é legitimado. É imediato

que r[x] = r“{x}. A notação usual em Matemáticas para r[x] é simplesmente
[x], isto é, r é subentendida.
Proposição 7.4 S ` (x, y ∈ F (r) ∧ equiv(r)) → (r[x] = r[y] ↔ (x r y)).
Demonstração: Assuma r[x] = r[y], isto é, (x r z) ↔ (y r z). Como y r y,

então x r y. Suponha agora x r y, e seja z tal que x r z. De sim(r) obtemos
y r x, e então inferimos: (y r x), (x r z) implica y r z, pois tran(r). De x r y
provamos analogamente (y r z) → (x r z). Isto é, r[x] = r[y].
Proposição 7.5 S ` equiv(r) → (r[x] = r[y] ∨ (r[x] ∩ r[y] = ∅)).
Demonstração: Suponha que r[x] 6= r[y]; se x 6∈ F (r) ou y 6∈ F (r) então

claramente r[x] ∩ r[y] = ∅. Se x, y ∈ F (r), então seja z ∈ r[x] ∩ r[y]. Logo
(x r z) e (y r z), donde obtemos x r y e posteriormente, pela Proposição 7.4,
r[x] = r[y], uma contradição . Portanto, r[x] ∩ r[y] = ∅.
Veremos a continuação a estreita relação entre partições e relações de equiva-

lência.
Definição 7.6 par(Π, a) denota

S
( Π = a) ∧ (∀b)(∀c)(((b ∈ Π) ∧ (c ∈ Π) ∧ b 6= c) → b ∩ c = ∅)∧
∧(∀x)(x ∈ Π → (∃y)(y ∈ x))
(“Π é uma partição de a”).
Por exemplo, se a = {1, 2, 3, 4, 5}, então Π = {{1, 4}, {2}, {3, 5}} é uma partição
de a, enquanto que
Π1 = {{1}, {2, 3, 4}}, Π2 = {{1, 2}, {2, 3}, {4}, {5}}
não são partições de a (porqué?). Observe que ∅ é a única partição possı́vel do

conjunto ∅.
Proposição 7.7 S ` a 6= ∅ → par({a}, a).
25
S
Demonstração: Temos que {a} = a. Dado que não existem b, c ∈ {a}
com b 6= c, então a segunda condição de par(Π, a) é trivialmente satisfeita.
Finalmente, seja x ∈ {a}; é claro que x = a. Dado que a 6= ∅, então existe
y ∈ a, e a terceira condição de par(Π, a) é satisfeita por Π = {a}.
Um conceito importante entre partições é a relação mais fina que. Intuitiva-

mente, uma partição Π1 é mais fina que Π2 se todo elemento de Π1 está contido
em algum elemento de Π2 , e dai a denominação mais fina resulta óbvia. Por
exemplo, considere as seguintes partições de a = {1, 2, 3, 4, 5}:
Π1 = {{1}, {2, 3}, {4, 5}}, Π2 = {{1}, {2, 3}, {4}, {5}},
Π3 = {{1}, {2}, {3}, {4}, {5}}, Π4 = {{1, 2, 3}, {4}, {5}}.
É imediato que Π2 é mais fina que Π1 e Π4 , enquanto que Π3 é mais fina do que
as outras partições. Por outro lado, Π1 e Π4 não são comparáveis pela relação
“mais fina que”.
Definição 7.8 mf (Π1 , Π2 ) denota Π1 6= Π2 ∧ (∀x)(x ∈ Π1 → (∃y)((y ∈ Π2 ) ∧

(x ⊆ y))) (“a partição Π1 é mais fina do que a partição Π2 ”).
Proposição 7.9 Todo conjunto tem uma partição mais fina do que todas as
outras partições do conjunto.
Demonstração: Seja Π = {y : y ∈ P(a) ∧ (∃x)((x ∈ a) ∧ y = {x})}.

Temos que Π é legitimado por [A2], e podemos escrever
S Π = {{x} : x ∈ a}.
Provaremos
S par(Π, a). Primeiro de tudo, temos Π = a. Com efeito, seja
x ∈ Π; logo, existe y ∈ Π tal que x ∈ y. Mas y = {z} com z ∈ a, pela
definição
S de Π. Daqui, x ∈ y, y = {z} implica x = z e logo x ∈ a. Isto é,
ΠS⊆ a. Por outro lado,
S seja x ∈ a; logo y = {x} ∈ Π tal que x ∈ y, donde
x ∈ Π, isto é, a = Π. Sejam b, c ∈ Π com b 6= c. Logo b = {x}, c = {y}
tal que x, y ∈ a. Portanto, b 6= c implica x 6= y, e então b ∩ c = ∅. Finalmente,
b ∈ Π implica que b = {x} para algum x ∈ a; daqui x ∈ b e logo (∃z)(z ∈ b).
Isto prova que par(Π, a). Suponha S agora que par(Π1 , a) e Π1 6= Π. Seja y ∈ Π;
logo y = {x} com x ∈ a. Como Π1 = a, então existe z ∈ Π1 tal que x ∈ z,
donde y = {x} ⊆ z, isto é, mf (Π, Π1 ).
Vemos então que Π3 no exemplo acima é de fato a partição mais fina sobre a.
Provaremos a continuação que toda relação de equivalência sobre um con-
junto a origina uma partição sobre a.
Definição 7.10 Π(r) = {b : (∃x)(x ∈ F (r) ∧ b = r[x])}.
É imediato que Π(r) = {b : (b ∈ P(F (r))) ∧ (∃x)(x ∈ F (r) ∧ b = r[x])},

portanto Π(r) é legitimado por [A2]. O resultado procurado é o seguinte:
Proposição 7.11 S ` equiv(r, a) → par(Π(r), a).
26
Demonstração: Temos que equiv(r, a) implica S equiv(r)∧(a = F (r)). Podemos
escrever Π(r) = {r[x] : x ∈ a}. Seja y ∈ SΠ(r); logo existe x ∈ a tal que
y ∈ r[x], donde x r y, isto é, y ∈ a. Daqui Π(r) S⊆ a. Por outro S lado, seja
x ∈ a. Logo (x ∈ r[x]) ∧ (r[x] ∈ Π(r)), donde x ∈ Π(r). Isto é, Π(r) = a.
Sejam r[x], r[y] ∈ Π(r). Se r[x] 6= r[y] então r[x] ∩ r[y] = ∅, pela Proposição 7.5.
Finalmente, dado r[x] ∈ Π(r), temos que x ∈ r[x], isto é, (∃y)(y ∈ r[x]),
provando assim que par(Π(r), a).
Podemos relacionar a inclusão de relações de equivalência com a relação “mais

fina que” das partições associadas.
Proposição 7.12 S ` (equiv(r, a) ∧ equiv(s, a)) → (r ⊂ s ↔ mf (Π(r), Π(s)).
Demonstração: Assuma equiv(r, a)∧equiv(s, a). Suponha r ⊂ s; como r 6= s,

existem x, y ∈ a tais que x s y mas ¬(x r y). Desta maneira, y ∈ s[x] − r[x]
e então r[x] 6= s[x]. Seja z ∈ r[x]; portanto x r z, donde x s z, pois r ⊂ s.
Daqui z ∈ s[x], e então r[x] ⊂ s[x]. Assim r[x] 6= s[w] para todo w ∈ a, pois
par(Π(s), a). Daqui r[x] ∈ Π(r) − Π(s) e então Π(r) 6= Π(s). Seja y ∈ Π(r);
logo y = r[x] para algum x ∈ a, e então r[x] ⊆ s[x], com s[x] ∈ Π(s), pois
r ⊂ s. Isto é, mf (Π(r), Π(s)). Reciprocamente, suponha mf (Π(r), Π(s)). Logo
Π(r) 6= Π(s). Se x r y então y ∈ r[x]; mas r[x] ⊆ s[z] para algum z, donde
y ∈ s[z], isto é, y s z. Mas x ∈ r[x] ⊆ s[z], portanto x ∈ s[z], donde x s z. De
y s z obtemos z s y e então x s y; logo r ⊆ s. Finalmente, suponha que r = s.
Logo, r[x] = s[x] para todo x ∈ a, donde Π(r) = Π(s), contradição. Portanto
r ⊂ s.
Provaremos agora que uma partição origina uma relação de equivalência.
Definição 7.13 r(Π) = {hx, yi : (∃b)((b ∈ Π) ∧ x, y ∈ b)}.
É imediato que r(Π) é legitimado, pois

[ [
r(Π) = {z : z ∈ ( Π)×( Π)∧(∃x)(∃y)(z = hx, yi∧(∃b)((b ∈ Π)∧x, y ∈ b))}.
Proposição 7.14 S ` par(Π, a) → equiv(r(Π), a).
Demonstração: É imediato que par(Π, a) implica F (r(Π)) = a. Se x ∈ a,

então existe b ∈ Π tal que x ∈ b; daqui x r(Π) x, isto é, ref (r(Π), a) . A prova
da simetria de r(Π) é imediata. Sejam x, y ∈ a tais que x r(Π) y, y r(Π) z; então
x, y ∈ b e y, z ∈ c para b, c ∈ Π. Logo y ∈ b ∩ c, donde b = c. Daqui x, z ∈ c,
c ∈ Π, e então x r(Π) z. Isto é, tran(r(Π), a), portanto equiv(r(Π), a).
Vamos agora relacionar partições com relações de equivalência. Provaremos

que, partindo de uma relação de equivalência r, então a partição Π(r) é tal que
a relação de equivalência gerada, r(Π(r)), coincide com r. Analogamente, a
relação r(Π) gerada por uma partição Π é tal que Π(r(Π)) = Π.
Proposição 7.15 S ` (par(Π, a) ∧ equiv(r, a)) → (Π = Π(r) ↔ r(Π) = r).
27
Demonstração: Assuma par(Π, a) ∧ equiv(r, a). Suponha Π = Π(r). De
equiv(r, a) obtemos x r y sse (∃z)(x, y ∈ r[z]). Mas b ∈ Π sse (∃z)(b = r[z]),
por hipótese. Logo
x r y sse (∃b)(x, y ∈ b ∧ b ∈ Π) sse x r(Π) y,
isto é, r = r(Π). Reciprocamente, suponha r = r(Π). Se b ∈ Π, então existe

x ∈ a tal que x ∈ b. Portanto y ∈ b sse x r(Π) y sse x r y sse y ∈ r[x].
Daqui b = r[x] ∈ Π(r). Por outro lado, seja r[x] ∈ Π(r). Como x ∈ a, então
existe b ∈ Π tal que x ∈ b. Portanto b = r[x], como acabamos de provar. Logo
r[x] ∈ Π. Isto é, Π = Π(r).
Finalmente provaremos que a relação “mais fina que” é de fato uma ordem
parcial estrita. Considere P AR(a) = {Π : par(Π, a)}. Temos que P AR(a) é
legitimado, pois
P AR(a) = {Π : Π ∈ PP(a) ∧ par(Π, a)}
Considere agora
<a = {u : u ∈ P AR(a) × P AR(a) ∧ (∃Π1 )(∃Π2 )(u = hΠ1 , Π2 i ∧ mf (Π1 , Π2 )}
Temos que <a é legitimado por [A2], e Π1 <a Π2 sse mf (Π1 , Π2 ) para toda
Π1 , Π2 ∈ P AR(a).
Proposição 7.16 (a) S ` (Π1 <a Π2 ) ↔ (r(Π1 ) ⊂ r(Π2 )).

(b) S ` ope(<a , P AR(a)).
Demonstração: (a) Sejam Π1 , Π2 ∈ P AR(a). Logo,
Π1 <a Π2 sse mf (Π1 , Π2 ) sse
mf (Π(r(Π1 )), Π(r(Π2 ))) ∧ equiv(r(Π1 ), a) ∧ equiv(r(Π2 ), a)

(por 7.14, 7.11, 7.15) sse
r(Π1 ) ⊂ r(Π2 ) (por 7.12).
(b) Sejam Π1 , Π2 ∈ P AR(a) tais que Π1 <a Π2 ; por (a) temos que r(Π1 ) ⊂
r(Π2 ). Se Π2 <a Π1 então r(Π2 ) ⊂ r(Π1 ), uma contradição. Logo, <a é
asimétrica. Se Π1 <a Π2 , Π2 <a Π3 , então r(Π1 ) ⊂ r(Π2 ) e r(Π2 ) ⊂ r(Π3 ),
donde r(Π1 ) ⊂ r(Π3 ). Portanto Π1 <a Π3 , por (a). Isto é, <a é uma ordem
parcial estrita em P AR(a).
Exemplo 7.17 Fixemos k ∈ Z, onde Z denota o conjunto dos números inteiros.

Definimos em Z a relação seguinte:
n Rk m sse k|(n − m) sse existe z ∈ Z tal que n − m = z.k .
28
Observe que n Rk m sse n e m tém o mesmo resto na divisão por k. Com efeito,
assumamos que n Rk m; logo, n − m = z.k. Por outro lado, n = z1 .k + r1 ,
m = z2 .k + r2 , onde 0 ≤ r1 , r2 < k. Se r1 ≥ r2 , então
n − m = (z1 .k + r1 ) − (z2 .k + r2 ) = (z1 − z2 ).k + (r1 − r2 ) = z.k
onde 0 ≤ r1 − r2 < k. Pela unicidade do algoritmo da divisão, temos que
r1 − r2 = 0, donde r1 = r2 . Analogamente, se r1 ≤ r2 , então
m − n = (z2 .k + r2 ) − (z1 .k + r1 ) = (z2 − z1 ).k + (r2 − r1 ) = (−z).k
onde 0 ≤ r2 − r1 < k. Pela unicidade do algoritmo da divisão, temos que
r2 − r1 = 0, donde r1 = r2 . Reciprocamente, se n e m têm o mesmo resto na
divisão por k, então n = z1 .k + r1 , m = z2 .k + r1 , portanto n − m = (z1 − z2 ).k,
donde k|(n − m), isto é, n Rk m. Provaremos a seguir que Rk é uma relação de
equivalência (observe que F (Rk ) = Z).
Se n ∈ Z, então n − n = 0 = 0.k, donde n Rk n, isto é, Rk é reflexiva.
Se n Rk m, então n − m = z.k, donde m − n = (−z).k, com −z ∈ Z; isto é,
m Rk n. Finalmente, assumamos que n Rk m, m Rk w. Logo, n − m = z1 .k,
m − w = z2 .k, donde n − w = (n − m) + (m − w) = z1 .k + z2 .k = (z1 + z2 ).k, com
z1 + z2 ∈ Z. Daqui n Rk w, e Rk é uma relação de equivalência. O conjunto
Π(Rk ) é usualmente denotado por Zk . Observe que Rk = R−k para todo k ∈ Z.
Para ilustrar estas definições, considere k = 6; logo, os únicos restos possı́veis
da divisão de n por 6 são: 0, 1,. . . , 5. Daqui inferimos que as únicas classes
de equivalência possı́veis para R6 são n ≡def R6 [n], com 0 ≤ n ≤ 5, portanto
Z6 = {0, . . . , 5}, sendo que, para 0 ≤ n ≤ 5, n é o conjunto dos números inteiros
m tais que o resto da divisão de m por 6 é n. Analogamente, Z3 = {0, 1, 2},
onde agora n = {m : o resto da divisão de m por 3 é n} (n = 0, 1, 2). Observe
que, se 6|(n − m), então 3|(n − m), pois 3|6; daqui, R6 é mais fina do que R3 .
Dado que 3 = 1.3+0, 4 = 1.3+1, 5 = 1.3+2, então R6 [3] ⊆ R3 [0], R6 [4] ⊆ R3 [1]
e R6 [5] ⊆ R3 [2], donde
R3 [0] = R6 [0] ∪ R6 [3], R3 [1] = R6 [1] ∪ R6 [4], R3 [2] = R6 [2] ∪ R6 [5].
Em geral, Rm é mais fina do que Rn sse n|m. Temos portanto que R0 produz a
partição mais fina de Z, pois m|0 para todo m. Para verificar isto diretamente,
observe que n R0 m sse n − m = z.0 = 0 sse n = m, donde R0 [n] = {n}
para todo n ∈ Z. Por outro lado, R1 produz a partição menos fina {Z}. Com
efeito, 1|n para todo n, donde Rn é mais fina do que R1 . É claro que n R1
m sse 1|(n − m), condição que resulta verdadeira para todo n, m ∈ Z, e então
R1 [0] = Z.
8 Funções
O importante conceito de função, cuja definição foi discutida até finais do século
19, pode ser introduzido elegantemente na linguagem da TC. Informalmente,
uma função é uma relação em que cada elemento do domı́nio tem associado
um único elemento na imagem; isto não proibe, é claro, que dois elementos
diferentes do domı́nio possam ter associados o mesmo elemento na imagem.
29
Definição 8.1 f un(f ) denota rel(f ) ∧ (∀x)(∀y)(∀z)(((x f y) ∧ (x f z)) → y =
z) (“f é uma função”).
É claro que f un(f ) equivale a: rel(f ) ∧ (∀x)(x ∈ dom(f ) → (∃!y)(x f y)).
Usaremos a notação f (x) para indicar o único y tal que x f y. Por exemplo, se
f = {h1, 2i, h2, 2i, h3, 5i}, então f (1) = 2, f (2) = 2, f (3) = 5. A notação f (x)
(introduzida na Definição 5.1) é legitimada pela Proposição 5.3. A composição
f • g de duas funções f , g é definida de maneira que (f • g)(x) = f (g(x)).
Isto significa que f • g é a composição (como relações) g ◦ f introduzida na
Definição 5.6.
Lema 8.2 (a) S ` f un(f ) → (∀x)(∀y)((x f y) → y = f (x)).
(b) S ` (f un(f ) ∧ x ∈ dom(f )) → (x f f (x)).
Demonstração: (a) Assuma f un(f ). Se x f y, provaremos:
z ∈ y ↔ (∃u)((∀w)((x f w) ↔ w = u) ∧ z ∈ u)
(lembrando que a formula à direita do primeiro “ ↔ ” significa “z ∈ f (x)”).

Daqui, teremos, por [A1], que y = f (x). Com efeito, temos o seguinte:
f un(f ), x f y, x f w implica w = y; x f y, w = y implica x f w, portanto
f un(f ), x f y implica (∀w)(x f w ↔ w = y), donde f un(f ), x f y, z ∈ y implica
(∀w)(x f w ↔ w = y)∧z ∈ y. Daqui obtemos (∃u)((∀w)((x f w) ↔ w = u)∧z ∈
u), isto é: f un(f ), x f y implica z ∈ y → z ∈ f (x).
Por outro lado, x f y, (∀w)((x f w) ↔ w = u) implica (x f y) ∧ (x f u), donde,
usando f un(f ), obtemos y = u. Daqui, provamos: f un(f ), x f y, z ∈ f (x)
implica z ∈ y, isto é: f un(f ), x f y implica z ∈ f (x) → z ∈ y, portanto f un(f ),
x f y implica y = f (x).
(b) Assuma f un(f ) ∧ x ∈ dom(f ). Provaremos que x f f (x). Com efeito,
f un(f ), x f u implica u = f (x), por (a). Logo, f un(f ), x f u implica x f
f (x). Portanto f un(f ), (∃u)(x f u) implica x f f (x). Mas x ∈ dom(f ) implica
(∃u)(x f u), portanto: f un(f ), x ∈ dom(f ) implica x f f (x).
Proposição 8.3 (a) S ` (f un(f ) ∧ f un(g)) → ((x (g ◦ f ) y) → y = f (g(x))).

(b) S ` (f un(f ) ∧ f un(g) ∧ x ∈ dom(g) ∧ g(x) ∈ dom(f )) → (x (g ◦ f ) f (g(x))).
Demonstração: (a) Se x (g ◦ f ) y, então x g z, z f y para algum z. Pelo

Lema 8.2(a) obtemos z = g(x) e y = f (z), donde y = f (g(x)), pelas regras da
igualdade.
(b) Pelo Lema 8.2(b), temos que g(x) f f (g(x)), pois g(x) ∈ dom(f ). Como
x ∈ dom(g), então x g g(x), novamente por 8.2(b). Daqui obtemos: x g g(x),
g(x) f f (g(x)), e então x (g ◦ f ) f (g(x)), pela Definição 5.6.
Vemos assim que f • g ≡def g ◦ f satisfaz a propriedade desejada x (f • g) y sse

y = f (g(x)) (sob certas condições razoáveis estabelecidas na Proposição 8.3(b)).
Uma propriedade fundamental é que a composição de funções é uma função.
Proposição 8.4 (a) S ` (f un(f ) ∧ f un(g)) → (f un(f ∩ g) ∧ f un(f • g)).
(b) S ` (f un(f ) ∧ f un(g) ∧ x ∈ dom(f • g)) → (f • g)(x) = f (g(x)).
30
Demonstração: (a) Sejam x, y, z tais que , x (f ∩ g) y, x (f ∩ g) z. Daqui
obtemos x f y, x g y, x f z, x g z. Como f un(f ), f un(g), então y = z,
donde f un(f ∩ g). Por outro lado, suponha que x (f • g) y, x (f • g) z. Pela
Proposição 8.3(a) obtemos y = f (g(x)), z = f (g(x)), donde y = z e então
f un(f • g).
(b) Assuma f un(f ), f un(g), x ∈ dom(f • g). Pelo item (a) obtemos f un(f •
g), x ∈ dom(f • g), donde x (f • g) ((f • g)(x)), pelo Lema 8.2(b). Pela
Proposição 8.3(a) obtemos (f • g)(x) = f (g(x)).
Daqui em diante, quando não houver risco de confusão, escreveremos f ◦ g no

lugar de f • g, se f e g são funções. Algumas das propriedades provadas na
Proposição 5.10 podem ser fortalecidas, no caso em que f é função.
Proposição 8.5 (a) S ` (f • g)|z = f • (g|z).

(b) S ` f un(f ) → (f −1 “(a∩b) = f −1 “(a)∩f −1 “(b))∧(f −1 “(a−b) = f −1 “(a)−
f −1 “(b)).
Demonstração: (a) É uma reformulação da Proposição 5.9(e).

(b) Assuma f un(f ). Pela Proposição 5.10(b),(c), basta provar
f −1 “(a) ∩ f −1 “(b) ⊆ f −1 “(a ∩ b),
e f −1 “(a − b) ⊆ f −1 “(a) − f −1 “(b).

Se x ∈ f −1 “(a) ∩ f −1 “(b), então existem y ∈ a, w ∈ b tais que x f y, x f
w. Como f un(a), então y = w, portanto y ∈ a ∩ b tal que x f y, donde
x ∈ f −1 “(a ∩ b).
Seja agora x ∈ f −1 “(a − b). Logo, existe y ∈ a − b tal que x f y, e então
x ∈ f −1 “(a). Se x ∈ f −1 “(b), então existe z ∈ b tal que x f z. Como f un(f ),
obtemos y = z donde y ∈ b, uma contradição. Portanto x ∈ f −1 “(a) − f −1 “(b).

Definição 8.6 inj(f ) denota f un(f ) ∧ f un(f −1 ) (“f é injetora”).
Proposição 8.7 (a) S ` (inj(f ) ∧ x, y ∈ dom(f )) → (f (x) = f (y) ↔ x = y).

(b) S ` (inj(f ) ∧ x ∈ dom(f ) ∧ y ∈ im(f )) → (f −1 (y) = x ↔ y = f (x)).
(c) S ` (inj(f ) ∧ x ∈ dom(f )) → f −1 (f (x)) = x.
(d) S ` (inj(f ) ∧ y ∈ im(f )) → f (f −1 (y)) = y.
(e) S ` (inj(f ) ∧ inj(g)) → inj(f ∩ g).
(f ) S ` (inj(f ) ∧ inj(g) ∧ dom(f ) ∩ dom(g) = ∅ ∧ im(f ) ∩ im(g) = ∅)
→ inj(f ∪ g).
Demonstração: (a) Assuma inj(f ) ∧ x ∈ dom(f ) ∧ y ∈ dom(f ). Se f (x) =

f (y), então obtemos que f (x) f −1 x, f (x) f −1 y. Mas f un(f −1 ), portanto
x = y. Reciprocamente, x = y implica f (x) = f (y), pelas regras da igualdade.
(b) Assuma inj(f ) ∧ x ∈ dom(f ) ∧ y ∈ im(f ). Como f un(f −1 ) ∧ y ∈ dom(f −1 ),
então x = f −1 (y) implica y f −1 x, pelo Lema 8.2(b). Daqui, x f y e então, pelo
Lema 8.2(a), obtemos y = f (x); isto é, x = f −1 (y) → y = f (x). Simetricamente
provamos y = f (x) → x = f −1 (y).
31
(c) Assuma inj(f ) ∧ x ∈ dom(f ). Logo f (x) ∈ im(f ) e f (x) = f (x). Pelo item
(b) obtemos x = f −1 (f (x)).
(d) Análogo ao item (c).
(e) Imediato a partir da Proposição 8.4 (a).
(f) x (f ∪ g) y, x (f ∪ g) z implica que (x f y) ∧ (x f z) ou (x g y) ∧ (x g z), mas
não ambas simultaneamente. Daqui y = z, e f un(f ∪ g). Da mesma maneira
(lembrando que (f ∪ g)−1 = f −1 ∪ g −1 ), x (f ∪ g)−1 y, x (f ∪ g)−1 z implica (x
f −1 y) ∧ (x f −1 z) ou (x g −1 y) ∧ (x g −1 z), mas não ambas simultaneamente.
Daqui y = z, e f un((f ∪ g)−1 ). Portanto inj(f ∪ g).
Definição 8.8 (a) f un(f, a, b) denota f un(f ) ∧ (dom(f ) = a) ∧ (im(f ) ⊆ b)

(“f é uma função de a em b”).
(b) sobre(f, a, b) denota f un(f )∧(dom(f ) = a)∧(im(f ) = b) (“f é uma função
sobrejetora de a em b”).
(c) inj(f, a, b) denota inj(f ) ∧ (dom(f ) = a) ∧ (im(f ) ⊆ b) (“f é uma função
injetora de a em b”).
(d) bij(f, a, b) denota inj(f, a, b) ∧ sobre(f, a, b) (“f é uma função bijetora de
a em b”).
(e) ab = {f : f un(f, b, a)} (“ab é o conjunto de todas as funções de b em a”).
Observação 8.9 Podemos a partir de agora utilizar a notação usual f : a−→b

para denotar f un(f, a, b). De fato, utilizaremos as duas notações indistinta-
mente.
Proposição 8.10 (a) S ` (f un(f, a, b) ∧ f un(g, b, c)) → f un(g ◦ f, a, c).

(b) S ` inj(f, a, b) → (bij(f, a, im(f )) ∧ bij(f −1 , im(f ), a)).
(c) S ` bij(f, a, b) → bij(f −1 , b, a).
(d) S ` (bij(f, a, b) ∧ bij(g, b, c)) → bij(g ◦ f, a, c).
(e) S ` bij(f, a, b) → ((f ◦ f −1 = I(b)) ∧ (f −1 ◦ f = I(a))).
(f ) S ` f un(f, a, b) → ((I(b) ◦ f = f ) ∧ (f ◦ I(a) = f )).
Demonstração: (a) Notar que g ◦ f é utilizado para denotar g • f , isto é, f ◦ g

(como relações). Assuma então f : a−→b, g : b−→c. Daqui obtemos:
f un(f ), dom(f ) = a, im(f ) ⊆ b, f un(g), dom(g) = b, im(g) ⊆ c.
Pela Proposição 8.4(a) obtemos f un(g ◦ f ). Por definição de composição,

dom(g ◦ f ) ⊆ dom(f ), im(g ◦ f ) ⊆ im(g); isto é, dom(g ◦ f ) ⊆ a, im(g ◦ f ) ⊆ c.
Seja x ∈ a; pela Proposição 8.3(b) temos que x (g◦f ) (g(f (x)), pois a = dom(f )
e b = dom(g), donde x ∈ dom(f ) ∧ f (x) ∈ dom(g). Daqui x ∈ dom(g ◦ f ), isto
é, dom(g ◦ f ) = a. Portanto f un(g ◦ f, a, c).
(b) Observe que dom(f −1 ) = im(f ), im(f −1 ) = dom(f ). Assuma inj(f, a, b).
Logo, temos o seguinte:
f un(f ), f un(f −1 ), dom(f −1 ) = im(f ), im(f −1 ) = a.
Daqui obtemos imediatamente inj(f −1 , im(f ), a), sobre(f −1 , im(f ), a), isto é,
bij(f −1 , im(f ), a). A fórmula bij(f, a, im(f )) é obtida trivialmente.
32
(c) Por (b) inferimos bij(f, a, b) → bij(f −1 , b, a), pois im(f ) = b.
(d) Assuma bij(f, a, b), bij(g, b, c). Daqui obtemos:
f un(f, a, b), f un(f −1 , b, a), f un(g, b, c), f un(g −1 , c, b).
Por (a) e pela Proposição 5.8(d) obtemos f un(g ◦ f, a, c), f un((g ◦ f )−1 , c, a).
Daqui dom(g ◦ f ) = a, im(g ◦ f ) = c, f un(g ◦ f ), f un((g ◦ f )−1 ), e então
bij(g ◦ f, a, c).
(e) Por (a) temos f un(f ◦ f −1 , b, b), f un(f −1 ◦ f, a, a). Seja x ∈ b; x f ◦ f −1 y
implica x f −1 z, z f y para algum z ∈ a. Daqui z f x, z f y e então y = x, isto
é: (f ◦ f −1 )(x) = x para todo x ∈ b, donde f ◦ f −1 = I(b). Seja agora x ∈ a;
x f −1 ◦ f y implica x f z, z f −1 y para algum z ∈ b. Daqui z f −1 x, z f −1 y,
donde x = y, isto é: (f −1 ◦ f )(x) = x para todo x ∈ a. Portanto f −1 ◦ f = I(a).
(f) Por (a), f un(I(b) ◦ f, a, b) ∧ f un(f ◦ I(a), a, b). Seja x ∈ a; logo (I(b) ◦
f )(x) = I(b)(f (x)) = f (x), donde I(b) ◦ f = f . Por outro lado, (f ◦ I(a))(x) =
f (I(a)(x)) = f (x), donde f ◦ I(a) = f .
Proposição 8.11 (a) O termo ab é legitimado em S.

(b) a∅ = {∅}.
(c) a 6= ∅ → ∅a = ∅.
(d) ab = ∅ ↔ a = ∅ ∧ b 6= ∅.
(e) a{x} = {{hx, yi} : y ∈ a}.
(f ) a ⊆ b → ac ⊆ bc .
Demonstração: (a) Claramente ab = {f : f ∈ P(b × a) ∧ f un(f, b, a)},

legitimado portanto por [A2].
(b) a∅ ⊆ P(∅ × a) = P(∅) = {∅}. Por outro lado f un(∅, ∅, a) é satisfeita tri-
vialmente, e então a∅ = {∅}.
(c) Seja a 6= ∅, e suponha que f un(f, a, ∅). Seja x ∈ a; logo, x ∈ dom(f ),
portanto f (x) ∈ ∅, uma contradição.
(d) Assuma f ∈ ab . Se b 6= ∅, seja x ∈ b; portanto f (x) ∈ a, donde a 6= ∅,
provando assim: ab 6= ∅ → (b 6= ∅ → a 6= ∅). Mas b 6= ∅ → a 6= ∅ equivale
a ¬(a = ∅ ∧ b 6= ∅). Reciprocamente, suponha ¬(a = ∅ ∧ b 6= ∅), isto é,
a 6= ∅ ∨ b = ∅. Se a 6= ∅, seja y ∈ a. Logo, é imediato que f = {hx, yi : x ∈ b}
é legitimado, e f un(f, b, a). Daqui ab 6= ∅. Por outro lado, b = ∅ implica que
ab = {∅} =6 ∅, por (b). Portanto ¬(a = ∅ ∧ b 6= ∅) → ab 6= ∅.
(e) Seja b = {{hx, yi} : y ∈ a}; é claro que b é legitimado, e b ⊆ a{x} . Seja
f ∈ a{x} ; como dom(f ) = {x}, então f (x) ∈ a tal que f = {hx, f (x)i}; daqui
f ∈ b.
(f) Imediato das definições.
9 Equipolência
A noção de equipolência foi apontada por Cantor como um conceito fundamen-
tal, pois permite generalizar a noção de número natural para cardinais. Essen-
cialmente, dois conjuntos são equipolentes se existe uma bijeção entre eles, o
que equivale a afirmar que possuem o mesmo cardinal.
33
Definição 9.1 a ≈ b denota (∃f )bij(f, a, b) (“a e b são equipolentes”).
Exemplo 9.2 Sejam a = {1, 2, 3}, b = {3, 4, 5}. Então
f = {h1, 3i, h2, 4i, h3, 5i}, g = {h1, 5i, h2, 4i, h3, 3i}
são duas bijeções entre a e b, cada uma delas garantindo a ≈ b.
A intuição por trás de a ≈ b é que “a e b têm o mesmo número de elementos”,

o que pode ser percebido nos exemplos em que a e b são finitos (todas estas são
noções por enquanto intuitivas, mas serão formalizadas em ZF ). É também
claramente intuitivo que um conjunto finito não pode ser equipolente com um
subconjunto próprio. No caso de a ser infinito, esta propriedade deixa de ser
verdadeira: o conjunto P dos números naturais pares é um subconjunto próprio
do conjunto N dos números naturais, embora f (n) = 2.n seja uma bijeção entre
N e P. Vemos assim que a parte é menor do que a totalidade não tem mais
validade no caso infinito.
Proposição 9.3 (a) S ` a ≈ a.

(b) S ` (a ≈ b) → (b ≈ a).
(c) S ` ((a ≈ b) ∧ (b ≈ c)) → (a ≈ c).
Demonstração: (a) Pode ser provado facilmente que a relação I(a) intro-
duzida previamente à Proposição 6.2 é uma bijeção entre a e a.
(b), (c) São conseqüências imediatas da Proposição 8.10(c),(d), respectiva-
mente.
Os seguintes resultados serão úteis para a definição da artimética cardinal.
Proposição 9.4 As seguintes fórmulas são teoremas de S:

(a) ((a ≈ b) ∧ (c ≈ d) ∧ (a ∩ c = ∅) ∧ (b ∩ d = ∅)) → (a ∪ c ≈ b ∪ d).
(b) ((a ≈ b) ∧ (c ≈ d)) → (a × c ≈ b × d).
(c) a × b ≈ b × a.
(d) a × (b × c) ≈ (a × b) × c.
(e) (a × {x} ≈ a) ∧ ({x} × a ≈ a).
(f ) (∃c)(∃d)((a ≈ c) ∧ (b ≈ d) ∧ (c ∩ d = ∅)).
Demonstração: (a) Sejam f , g tais que bij(f, a, b), bij(g, c, d). Por hipótese
temos que dom(f ) ∩ dom(g) = ∅, im(f ) ∩ im(g) = ∅, portanto inj(f ∪ g), pela
Proposição 8.7(f). É imediato provar bij(f ∪ g, a ∪ c, b ∪ d).
(b) Sejam f , g tais que bij(f, a, b), bij(g, c, d). É imediato que h ⊆ (a×c)×(b×d)
dado por
h = {hhx, yi, hf (x), g(y)ii : (x ∈ a) ∧ (y ∈ c)}
é legitimado, estabelecendo uma bijeção h(hx, yi) = hf (x), g(y)i entre a × c e
b × d.
(c) É imediato que f (hx, yi) = hy, xi é uma bijeção entre a × b e b × a.
(d) f (hx, hy, zii) = hhx, yi, zi é uma bijeção entre a × (b × c) e (a × b) × c.
34
(e) f1 (hy, xi) = y, f2 (hx, yi) = y são bijeções.
(f) Sejam c = a × {∅}, d = b × {{∅}}. Logo a ≈ c, b ≈ d, pelo item (e), e
c ∩ d = ∅.
Os seguintes resultados serão utilizados para a exponenciação cardinal.

Proposição 9.5 Em S as seguintes fórmulas são teoremas:
(a) ((a ≈ b) ∧ (c ≈ d)) → (ac ≈ bd ).
(b) (b ∩ c = ∅) → (ab∪c ≈ ab × ac ).
(c) (a × b)c ≈ ac × bc .
(d) (ab )c ≈ ab×c .
Demonstração: (a) Se ac = ∅ então a = ∅ e c 6= ∅, donde b = ∅ e d 6= ∅.
Logo bd = ∅ e então ac ≈ bd . Suponha agora que ac 6= ∅. Sejam f , g tais que
bij(f, a, b), bij(g, c, d). Dada h ∈ ac , então f ◦ h ∈ bc , pela Proposição 8.10(a).
A partir dai, obtemos da mesma maneira f ◦ h ◦ g −1 ∈ bd . Definimos então
uma função f 0 (h) = f ◦ h ◦ g −1 tal que f 0 : ac −→bd . Dado h0 ∈ bd , então
h = f −1 ◦ h0 ◦ g é o único elemento de ac tal que h0 = f ◦ h ◦ g −1 = f 0 (h),
pela Proposição 8.10(e),(f). Portanto f 0 é uma bijeção com inversa f 0−1 (h0 ) =
f −1 ◦ h0 ◦ g.
(b) ab∪c = ∅ implica a = ∅, b ∪ c 6= ∅ implica a = ∅ e: b 6= ∅ ou c 6= ∅ implica
ab = ∅ ou ac = ∅ implica ab × ac = ∅. Logo ab∪c ≈ ab × ac . Suponha agora que
ab∪c 6= ∅. Dado f ∈ ab∪c , então hf |b, f |ci ∈ ab × ac . Defina
h = {hf, hf |b, f |cii : f ∈ ab∪c },
legitimado por [A2]. É claro que h : ab∪c −→ab × ac é uma função. Por outro
lado, se hf1 , f2 i ∈ ab × ac , então f1 ∪ f2 ∈ ab∪c tal que h(f1 ∪ h2 ) = hf1 , f2 i. Se
h(f ) = hf1 , f2 i, então f = f1 ∪ f2 , donde h−1 : ab × ac −→ab∪c é uma função.
Daqui infere-se que bij(h, ab∪c , ab × ac ).
(c) Se (a × b)c = ∅ então a × b = ∅ e c 6= ∅, donde a = ∅ ou b = ∅, e c 6= ∅.
Daqui ac = ∅ ou bc = ∅ donde ac × bc = ∅, e então (a × b)c ≈ ac × bc . Suponha
agora que (a × b)c 6= ∅. Dada f ∈ (a × b)c , considere
fa = {hx, yi : (∃z)(hx, hy, zii ∈ f )}, fb = {hx, zi : (∃y)(hx, hy, zii ∈ f )}.
Isto é, se π1 ∈ aa×b e π2 ∈ ba×b são dadas por π1 (hx, yi) = x e π2 (hx, yi) = y
(as projeções canônicas), então fa = π1 ◦ f e fb = π2 ◦ f . É claro que fa ∈ ac ,
fb ∈ bc , h = {hf, hfa , fb ii : f ∈ (a × b)c } é legitimado, e h : (a × b)c −→ac × bc
é uma função. Dada hf1 , f2 i ∈ ac × bc , então f = {hx, hf1 (x), f2 (x)ii : x ∈ c}
é legitimado, f ∈ (a × b)c , e h(f ) = hf1 , f2 i. E claro que h(f 0 ) = h(f ) implica
f = f 0 , portanto f un(h−1 , ac × bc , (a × b)c ) e assim bij(h, (a × b)c , ac × bc ).
(d) ab×c = ∅ implica a = ∅, b × c 6= ∅ implica a = ∅, b 6= ∅, c 6= ∅ implica ab = ∅,
c 6= ∅ implica (ab )c = ∅. Logo (ab )c ≈ ab×c . Suponha agora que ab×c 6= ∅. Seja
f ∈ ab×c . Para cada y ∈ c, seja
fy = {hx, zi : hhx, yi, zi ∈ f }.
É claro que fy é legitimado, fy ∈ ab , e fy (x) = f (hx, yi). Além disso, hf =
{hy, fy i : y ∈ c} ∈ (ab )c , onde hf (y) = fy . Portanto h = {hf, hf i : f ∈ ab×c }
35
é legitimado, e h : ab×c −→(ab )c é uma função, onde h(f ) = hf . Dada f 0 ∈
(ab )c , então f (hx, yi) = f 0 (y)(x) é uma função, f ∈ ab×c , e h(f ) = f 0 . Além
disso, h(f1 ) = h(f2 ) implica f1 = f2 , portanto f un(h−1 , (ab )c , ab×c ) e assim
bij(h, ab×c , (ab )c ).
Observação 9.6 Neste ponto da nossa exposição sobre a Teoria Axiomática

de Conjuntos assumiremos que o leitor já assimilou o fato de que os enuncia-
dos dos teoremas, assim como as respectivas demonstrações, são realizados no
marco formal de ZF (ou de certos fragmentos, tais como S). Para simplificar
a exposição, a partir daqui os enunciados e demonstrações dos teoremas de ZF
serão feitos numa linguagem coloquial, omitindo os detalhes mais formais.
Antecipando a definição de 2 = {∅, {∅}}, provamos o seguinte resultado útil,

introduzindo a idéia que os subconjuntos de um conjunto a são as funções
caracterı́sticas sobre a.
Proposição 9.7 Temos que P(a) ≈ 2a .
Demonstração: Seja b ⊆ a. Definimos a função gb : a−→2 pela regra: gb (x) =

{∅} se x ∈ b, e gb (x) = ∅ se x 6∈ b. Logo, h(b) = gb define uma função
h : P(a)−→2a . Por outro lado, h(b) = h(c) implica gb = gc , isto é, gb (x) = gb (x)
para todo x ∈ a. Portanto: gb (x) = {∅} sse gc (x) = {∅}, donde x ∈ b sse x ∈ c.
Por [A1] obtemos b = c, e então h é injetora. Por outro lado, se g ∈ 2a , considere
b = {x : x ∈ a ∧ g(x) = {∅}}. Logo b é legitimado por [A2], e claramente
h(b) = g. Daqui h é sobrejetora, e então h é uma bijeção entre P(a) e 2a . Assim
P(a) ≈ 2a .
Vamos definir a continuação o conceito de ser menor ou igual em termos de

tamanho (obviamente estes conceitos são ainda difusos).
Definição 9.8 a b denota (∃c)(c ⊆ b ∧ a ≈ c).
Proposição 9.9 (a) a ≈ b implica a b.

(b) a ⊆ b implica a b.
(c) a a ∪ b.
(d) a b e b c implica a c.
Demonstração: (a) Temos que a ≈ c com c = b ⊆ b. Logo a b.

(b) A função I(a) produz: a ≈ c com c = a ⊆ b. Logo a b.
(c) É uma conseqüência direta de (b).
(d) Suponha que a ≈ a1 (via f ) com a1 ⊆ b, e b ≈ b1 (via g) com b1 ⊆ c. Logo
g ◦ f é uma bijeção de a em g“a1 ⊆ c. Daqui a c.
O seguinte resultado, cuja demonstração é mais complicada, foi conjecturado

por Cantor e provado independientemente por Schröder e Bernstein em 1890.
A seguinte prova é devida a Fraenkel e Whitaker.
36
Teorema 9.10 (Cantor-Schröder-Bernstein)
Se a b e b a, então a ≈ b.
Demonstração: Seja f uma bijeção de a em b1 ⊆ b, e g uma bijeção de b em

a1 ⊆ a. Observe que o resultado (a ≈ b) estará provado se encontramos um
conjunto d ⊆ a tal que g|(b − f “d) é uma bijeção de b − f “d em a − d. Com
efeito, nesse caso teriamos que h = (f |d) ∪ (g −1 |(a − d)) é uma bijeção entre a
e b, como pode ser facilmente conferido usando a Proposição 8.7(f). O nosso
objetivo é portanto achar um conjunto d com a propriedade mencionada acima.
Para isso considere o conjunto
u = {c : c ⊆ a ∧ g“(b − f “(c)) ⊆ a − c}.
Dado que c ⊆ a sse c ∈ P(a), então u é legitimado por [A2].

Fatos: (1) Dados x, y ⊆ z, então: x ⊆ z − y sse y ⊆ z − x, e x = z − y sse
y = z − x. S
(2) Sejam z, y conjuntos. Se x ⊆ y para todo x ∈ z, então z ⊆ y.
S c1 ⊆ c2 ⊆ a, entãoSa − g“(b − f “c1 ) ⊆ a − g“(b − f “c2 ).
(3) Se
(4) u ⊆ a − g“(b − f “ u) (onde u é deinido como acima).
Com efeito:
(1) Suponha que x ⊆ z −y. Seja w ∈ y; logo, w ∈ z, pois y ⊆ z. Se w ∈ x, então
w ∈ z − y, isto é, w 6∈ y, uma contradição. Portanto w 6∈ x, donde w ∈ z − x e
então y ⊆ z − x. Simetricamente, y ⊆ z − x implica x ⊆ z − y. Para a segunda
parte, suponha que x = z − y; logo x ⊆ z − y e então, pela primeira parte,
y ⊆ z − x. Seja w ∈ z − x; se w 6∈ y, então w ∈ z − y = x. Mas w 6∈ x, por
hipótese. Esta contradição mostra que w ∈ y, isto é: z − x = y. A prova de
que y = z − x implica x = z − y é simétrica. S
(2) Assuma que x ⊆ y paraStodo x ∈ z, e seja w ∈ z. Logo w ∈ x para algum
S ∈ z, pela definição de z. Mas x ⊆ y, por hipótese; logo w ∈ y. Daqui
x
z ⊆ y.
(3) Se c1 ⊆ c2 ⊆ a, então f “c1 ⊆ f “c2 ⊆ b donde b − f “(c2 ) ⊆ b − f “(c1 ). Por-
tanto
g“(b − f “(c2 )) ⊆ g“(b − f “(c1 )) ⊆ a
e então a − g“(b − f “c1 ) ⊆ a − g“(b − f “c2 ).
(4) Seja c ∈ u; logo g“(b − f “(c)) ⊆ a − c e então, por (1),
c ⊆ a − g“(b − f “(c)). (∗)

S S
Por outro lado u ⊆ a, por (2). Além disso, S c ⊆ u: Scom efeito, se x ∈ c
então (x ∈ c) ∧ (c ∈ u) portanto S x ∈ u. De c ⊆ u ⊆ a infere-se Sque
a − g“(b − f “(c)) ⊆ a − g“(b − f “S u), por (3). Portanto
S c ⊆ a − g“(b − f “ u)
para todo c ∈ u, por (∗), donde u ⊆ a − g“(b − f “ u), por (2). Isto conclui
a prova dos Fatos. S S
Considere w = a − g“(b − f “ u). Por (4) temos que u ⊆ w ⊆ a, logo
[
w = a − g“(b − f “ u) ⊆ a − g“(b − f “w),
37
S
por (3). PorS(1) obtemos g“(b − f “w) ⊆ a − w, isto é, w ∈ u. Daqui w ⊆ u,
donde w = u. Isto é,
[ [
a − g“(b − f “ u) = u.
S S
PelaSsegunda parte de (1) obtemos g“(b − f “ u) = a − u. Vemos assim que
d = u satisfaz a propriedade requerida.
Proposição 9.11 Se a b e c d, então:

(i) Se b ∩ d = ∅ então a ∪ c b ∪ d;
(ii) a × c b × d;
(iii) ac bd se não é o caso que: a = b = c = ∅ e d 6= ∅.
Demonstração: Sejam f1 e f2 bijeções de a em b1 ⊆ b e de c em d1 ⊆ d,

respectivamente.
(i) Temos que a ∪ c = (a − c) ∪ c, com (a − c) ∩ c = ∅. Como b ∩ d = ∅, então
f1 “(a − c) ∩ d1 = ∅. Portanto h = (f1 |(a − c)) ∪ f2 é uma bijeção entre a ∪ c e
f1 “(a − c) ∪ d1 ⊆ b ∪ d.
(ii) Pela Proposição 9.4(b), a × c ≈ b1 × d1 ⊆ b × d.
(iii) a ≈ b1 e c ≈ d1 implicam que ac ≈ bd11 ⊆ bd1 , pela Proposição 9.5(a). A
prova estará terminada se encontrarmos uma injeção de bd1 em bd . O único
caso em que isto não é possı́vel é quando bd = ∅ e bd1 6= ∅, e é por isso que
a hipótese adicional (não é o caso que a = b = c = ∅ e d 6= ∅) foi colocada.
Com efeito, se bd = ∅, então d 6= ∅ e b = ∅, pela Proposição 8.11(d). Nesse caso
a = ∅. Agora, se d1 = ∅ (o que equivale a ter bd1 6= ∅), então c = ∅, donde
a = b = c = ∅ e d 6= ∅, contrariando a nossa hipótese. Logo d1 6= ∅ e então
bd1 = ∅, pela Proposição 8.11(d). Ou seja: bd = ∅ implica bd1 = ∅, e então
ac = ∅, donde ac bd . Suponha finalmente que bd 6= ∅. Os casos bd1 = ∅ ou
d = ∅ implicam trivialmente que ac bd . Suponha então que bd1 6= ∅ e d 6= ∅.
Dado que bd 6= ∅ e d 6= ∅, então b 6= ∅. Fixemos x0 ∈ b. Para f ∈ bd1 e x ∈ d,
defina

f (x) se x ∈ d1
h(f )(x) = .
x0 se x ∈ d − d1
Ou seja: h(f ) = f ∪ {hx, x0 i : x ∈ d − d1 }. Claramente h(f ) ∈ bd e então

h : bd1 −→bd é uma função. Observe que f ∩ {hx, x0 i : x ∈ d − d1 } = ∅ (pois
hx, yi ∈ f implica x ∈ d1 implica hx, yi 6∈ {hx, x0 i : x ∈ d − d1 }). Daqui
h(f ) = h(g) implica f = g, isto é, h é injetora. Seja g é uma bijeção entre ac
e bd11 (lembre que ac ≈ bd11 ). Daqui h ◦ g é uma bijeção de ac em h“(bd11 ) ⊆ bd ,
isto é, ac bd .
Definição 9.12 a ≺ b denota a b ∧ ¬(b a).
Proposição 9.13 (i) Não é o caso que a ≺ a.

(ii) Se a ≺ b então não é o caso que b ≺ a.
(iii) Se a ≺ b e b ≺ c então a ≺ c.
38
Demonstração: (i) Pela Definição 9.12, a ≺ a sse a a e não é o caso que
a a, uma contradição. Logo não é o caso que a ≺ a.
(ii) Assuma a ≺ b; isto implica que a b e não b a. Por outro lado, b ≺ a
equivale a b a e não a b. Portanto não podemos ter b ≺ a, pois a b, por
hipótese.
(iii) Assuma a ≺ b e b ≺ c. Logo a b e b c, donde a c. Se c a, então
c b, contrariando b ≺ c. Portanto não podemos ter c a, donde a ≺ c.
Estabeleceremos algumas relações entre e ≺.
Proposição 9.14 (i) Se a b então não b ≺ a.

(ii) Se a b e b ≺ c então a ≺ c.
(iii) Se a ≺ b e b c, então a ≺ c.
(iv) a b sse a ≈ b ou a ≺ b.
Demonstração: (i) Pela Definição 9.12, b ≺ a implica que não a b. Portanto

a b implica b 6≺ a.
(ii) Assuma a b e b ≺ c. Daqui a b e b c, donde a c. Se c a então
c b, contrariando b ≺ c. Portanto não é o caso que c a, donde a ≺ c.
(iii) Assuma a ≺ b e b c. Como antes, obtemos a c. Se c a então b a,
pois b c; mas isto contraria a ≺ b. Portanto c 6 a, donde a ≺ c.
(iv) Assuma que a b. Se a 6≺ b então, pela Definição 9.12, inferimos que
b a ou a 6 b. Daqui obtemos que b a e então, pelo Teorema 9.10, a ≈ b.
provamos desta maneira que a b implica a ≈ b ou a ≺ b. Reciprocamente,
suponha que a ≈ b. Logo a b. Se a ≺ b, então a b, pela Definição 9.12.
Isto prova que a ≈ b ou a ≺ b implica a b.
Observe que o item (iv) da proposição acima justifica a denominação intuitiva

de menor ou igual para a relação .
Teorema 9.15 (Cantor) a ≺ P(a).
Demonstração: A função f (x) = {x} de a em P(a) é injetora, portanto

a P(a). Suponha que a ≈ P(a) via uma função g : a−→P(a). Considere
b = {y : (y ∈ a) ∧ (y 6∈ g(y))}.
É claro que b é legitimado por [A2], e b ∈ P(a). Como g é sobrejetora, deve

existir algum x ∈ a tal que g(x) = b. Portanto:
x ∈ g(x) sse x 6∈ g(x).
Daqui inferimos que não pode existir uma tal g, isto é, a 6≈ P(a). Por outro
lado, observe que Teorema 9.10 pode ser refraseado como: a b implica (a 6≈ b
implica b 6 a). Logo, de a P(a) e a 6≈ P(a) inferimos, pelo Teorema 9.10,
que P(a) 6 a. Pela Definição 9.12, a ≺ P(a).
39
10 Conjuntos Finitos
Estudaremos nesta seção os conjuntos finitos. A definição intuitiva de conjunto
finito é a seguinte: um conjunto a é finito se a tem n elementos, para algum
número natural n. Esta idéia é correta, mas utiliza o conceito de números
inteiros. Dedekind propôs em 1888 uma definição não numérica extremamente
elegante: um conjunto a é finito se a não é equipolente com nenhum subconjunto
próprio. Em outras palavras, os conjuntos finitos são exatamente aqueles em
que a parte é menor do que o todo. É evidente que esta definição pode ser
facilmente introduzida em ZF . O problema que envolve esta definição é que,
para provar que todo conjunto finito (no sentido de Dedekind) é finito (no
sentido usual), devemos usar o Axioma da Escolha [AE]. Este axioma, a ser
introduzido posteriormente, é o mais questionado dos axiomas da TC, existindo
inclusive TCs que rejeitam este princı́pio (de fato, na literatura são diferenciados
os sistemas ZF e ZF C, sendo que ZF C consiste de ZF com o acréscimo do
Axioma da Escolha). Tarski propôs em 1924 a seguinte definição de finitude a
qual, embora seja menos intuitiva, tem a vantagem que não requer [AE] para
provar a equivalência com a definição usual de finitude.
Definição 10.1 (i) min(x, u) denota x ∈ u ∧ (∀y)(y ∈ u → ¬(y ⊂ x))

(“x é um elemento minimal de u”).
(ii) max(x, u) denota x ∈ u ∧ (∀y)(y ∈ u → ¬(x ⊂ y))
(“x é um elemento maximal de u”).
Por exemplo, se b = {1, 2, 3, 4} e u ⊆ P(b), u = {{1, 2, 4}, {2}, {2, 4}, {1, 3}},
então {1, 2, 4} e {1, 3} são os elementos maximais de u, enquanto que {2} e
{1, 3} são os elementos minimais de u. Por outro lado, seja b = N e
Nn = N−{1, . . . , n−1} = {n, n+1, n+2, . . .} (n ∈ N); u = {Nn : n ∈ N} ⊆ P(b).
Dado que Nn ⊂ Nm se n > m, então u não tem elementos minimais. Esta é

a situação que caracteriza os conjuntos b infinitos, segundo a descoberta de
Tarski.
Definição 10.2 (Tarski) f in(b) denota a fórmula

(∀u)((u ⊆ P(b) ∧ (u 6= ∅)) → (∃z)min(z, u))
(“b é finito se toda famı́lia não vazia de subconjuntos de b possui um elemento
minimal”).
As primeiras propriedades simples da finitude são as seguintes:
Proposição 10.3 (i) ∅ é finito.

(ii) {x} é finito.
(iii) Se b é finito e c ⊆ b, então c é finito.
(iv) Se c é finito então c ∩ b e c − b são finitos.
Demonstração: (i) Observe que P(∅) = {∅}, portanto u = {∅} é a única

famı́lia não vazia de subconjuntos de ∅. É claro que ∅ é um elemento minimal
de u, portanto f in(∅).
40
(ii) Temos que P({x}) = {∅, {x}}. Logo, as únicas famı́lias não vazias de
subconjuntos de {x} são u1 = {∅}, u2 = {{x}}, e u3 = {∅, {x}}. É imediato que
todo conjunto da forma {z} tem um elemento minimal (o próprio z), portanto
u1 e u2 possuem elemento minimal. Finalmente, ∅ é o elemento minimal de u3 .
Isto prova f in({x}).
(iii) Assuma que b é finito, e seja c ⊆ b. Seja u ⊆ P(c), u 6= ∅. Logo u ⊆ P(b),
u 6= ∅. Dado que f in(b), então u possui um elemento minimal z. Daqui f in(c).
(iv) Suponha que c é finito. Para todo b temos que c − b ⊆ c e c ∩ b ⊆ c. Pelo
item (iii) obtemos que f in(c − b) e f in(c ∩ b).
A seguinte propriedade exige uma demonstração um pouco mais complicada.

Proposição 10.4 Se c e b são finitos, então c ∪ b é finito.
Demonstração: Assuma f in(c) e f in(b). Seja u ⊆ P(c∪b), u 6= ∅. Provaremos
que u tem um elemento minimal. Considere
w = {a : a ⊆ c ∧ (∃d)((d ⊆ b) ∧ a ∪ d ∈ u)}.
Temos que w 6= ∅. Com efeito, seja z ∈ u. Dado que z = (z ∩ c) ∪ (z − c), então

a = z ∩ c e d = z − c satisfazem: a ⊆ c; d ⊆ b (pois z ⊆ c ∪ b); a ∪ d ∈ u. Logo
a é um elemento de w. Daqui w ⊆ P(c), w 6= ∅. Como c é finito, deve existir
a∗ ∈ w minimal. Logo
(1) a∗ ∈ w, a∗ ⊆ c.
Considere agora
w1 = {d : d ⊆ b ∧ (a∗ ∪ d ∈ u)}.
Por (1) temos que a∗ ∪d ∈ u para algum d ⊆ b, logo d ∈ w1 . Portanto w1 ⊆ P(b),
w1 6= ∅. Como b é finito existe um elemento minimal d∗ ∈ w1 , donde
(2) d∗ ∈ w1 , d∗ ⊆ b, a∗ ∪ d∗ ∈ u.
Provaremos que a∗ ∪d∗ é um elemento minimal de u. Suponha que s ∈ u tal que

s ⊆ a∗ ∪ d∗ . Daqui s ∩ a∗ ⊆ a∗ ⊆ c e s ∩ d∗ ⊆ d∗ ⊆ b. Dado que s ⊆ a∗ ∪ d∗ , então
(3) s = s ∩ (a∗ ∪ d∗ ) = (s ∩ a∗ ) ∪ (s ∩ d∗ ).
Como s ∈ u obtemos que s ∩ a∗ ∈ w, e s ∩ a∗ ⊆ a∗ . Dado que a∗ é minimal,

inferimos s ∩ a∗ = a∗ . Por (3) obtemos que a∗ ∪ (s ∩ d∗ ) ∈ u, donde s ∩ d∗ ∈ w1 .
Logo s∩d∗ = d∗ , pois d∗ é minimal. Usando (3) vemos que s = a∗ ∪d∗ . Portanto
a∗ ∪ d∗ é um elemento minimal de u. Isto prova que c ∪ b é finito.
Corolário 10.5 Se b é finito, então b ∪ {x} é finito.
Podemos definir um princı́pio de indução para conjuntos finitos. Antes disso,

provaremos que existe uma caracterização da finitude em termos de conjuntos
maximais.
41
Proposição 10.6 (a) Toda famı́lia não vazia de subconjuntos de um conjunto
finito possui um elemento maximal.
(b) Se toda famı́lia não vazia de subconjuntos de um conjunto b possui um
elemento maximal, então b é finito.
Demonstração: (a) Dado a finito, seja u ⊆ P(a), u 6= ∅. Considere v =

{a − x : x ∈ u}. Claro que v é legitimado por [A2], v ⊆ P(a), e v 6= ∅ (pois
u 6= ∅). Como a é finito, existe a − x ∈ v minimal, onde x ∈ u. Provaremos que
x é maximal em u. Para isto, observe que
(1) para todo w, y ⊆ a temos que: y ⊂ w sse a − w ⊂ a − y.
A prova é simples, e é deixada como exercı́cio. Suponha então que x não é

maximal em u. Logo, deve existir y ∈ u tal que x ⊂ y. Por (1) obtemos
a − y ⊂ a − x, onde a − y ∈ v. Isto contradiz a minimalidade de a − x em v,
portanto x é maximal.
(b) A prova é análoga à do item anterior. Assim, considere u ⊆ P(b), u 6= ∅.
Logo
v = {b − x : x ∈ u}
é uma famı́lia não vazia de subconjuntos de b. Por hipótese, existe um elemento
maximal b − x em v, com x ∈ u. Utilizando (1) vemos que x é minimal em u,
portanto b é finito.
Teorema 10.7 Seja ϕ(b) uma fórmula em que b ocorre livre e nem c nem x
ocorrem livres (outras variáveis podem ocorrer livres em ϕ). Suponha o seguinte:
(i) c é finito;
(ii) ϕ(∅);
(iii) (∀x)(∀b)(((x ∈ c) ∧ (b ⊆ c) ∧ ϕ(b)) → ϕ(b ∪ {x})).
Então ϕ(c).
Demonstração: Considere u = {b : b ⊆ c ∧ ϕ(b)}. Logo u ⊆ P(c) e u 6= ∅

pois ∅ ∈ u, pela hipótese (ii). Dado que c é finito, por (i), então existe b ∈ u
maximal, pela Proposição 10.6(a). Provaremos que b = c, e logo ϕ(c) como
queriamos. Por redução ao absurdo, suponha que b 6= c. Como b ⊆ c, deve
existir x ∈ c − b. Por (iii), temos que ϕ(b ∪ {x}) e então b ∪ {x} ∈ u, sendo que
b ⊂ b ∪ {x}. Isto contradiz a maximalidade de b em u. Daqui b = c e ϕ(c).
Em particular, obtemos a seguinte formulação conjuntista do princı́pio de indução

para conjuntos finitos:
Teorema 10.8 Suponha o seguinte:

(i) c é finito;
(ii) ∅ ∈ w;
(iii) (∀x)(∀b)(((x ∈ c) ∧ (b ⊆ c) ∧ b ∈ w) → b ∪ {x} ∈ w).
Então c ∈ w.
42
Demonstração: Basta considerar no Teorema 10.7 a fórmula ϕ(b) como sendo
“b ∈ w”.
Observe que o Teorema 10.7 é uma conseqüência do Teorema 10.8 considerando

w = {b : (b ∈ P(c)) ∧ ϕ(b)} (legitimado por [A2]). Daqui, os Teoremas 10.7
e 10.8 são equivalentes. De fato, as propriedades (ii) e (iii) do Teorema 10.8
caracterizam os conjuntos finitos, como provaremos a seguir.
Proposição 10.9 c é finito sse c pertence a todo w satisfazendo as condições

(ii) e (iii) do Teorema 10.8.
Demonstração: Se c é finito, então a conclusão vale pelo Teorema 10.8. Reci-

procamente, assuma que c ∈ w para todo w satisfazendo as condições (ii) e (iii)
do Teorema 10.8. Seja w o conjunto de todos os subconjuntos finitos de c (w
é legitimado por [A2]; confira!). Pela Proposição 10.3(i) temos que ∅ ∈ w. Se
b ∈ w e x ∈ c então b ∪ {x} ∈ w pelo Corolário 10.5. Portanto w satisfaz as
condições (ii) e (iii) do Teorema 10.8, donde c ∈ w. Isto é, c é finito.
Proposição 10.10 Se c é finito e f é uma função com domı́nio c e imagem b,

então b é finito.
Demonstração: Seja w = {a : (a ⊆ c) ∧ f in(f “a)}. Provaremos pelo Teo-

rema 10.8 que c ∈ w, donde im(f ) = f “c resultará ser finito. Observe que
∅ ⊆ c e f “∅ = ∅ (finito); então ∅ ∈ w. Seja x ∈ c e a ∈ w; logo a ∪ {x} ⊆ c.
Como f é função, então f “{x} = {f (x)}, logo f “{x} é finito, pela Propo-
sição 10.3(ii). Daqui f “(a ∪ {x}) = f “a ∪ f “{x} é finito, pela Proposição 10.4,
e então a ∪ {x} ∈ w. Pelo Teorema 10.8 temos que c ∈ w, portanto im(f ) é
finito.
Proposição 10.11 Se c é finito, então P(c) é finito.
Demonstração: Considere w = {b : b ⊆ c ∧ f in(P(b))}. Temos que ∅ ∈ w.

Suponha b ∈ w e x ∈ c. Se x ∈ b então b ∪ {x} ∈ w. Se x 6∈ b, então b ∪ {x} ⊆ c.
Defina
f = {ha, a ∪ {x}i : a ∈ P(b)}.
Temos que f é legitimado por [A2], e f é função com domı́nio P(b) (finito). Pela
Proposição 10.10 temos que a imagem de f é finita. Seja z = P(b ∪ {x}) − P(b).
Provaremos que im(f ) = z. Com efeito, dado a ∈ P(b), temos que a ∪ {x} ∈ z,
pois x 6∈ b. Logo im(f ) ⊆ z. Por outro lado, se d ∈ z, então x ∈ d, d − {x} ∈
P(b) e d = (d − {x}) ∪ {x}. Daqui f (d − {x}) = d, portanto d ∈ im(f ).
Provamos então que z = im(f ) é finito. Mas P(b ∪ {x}) = z ∪ P(b), portanto
P(b ∪ {x}) é finito, pela Proposição 10.4. Desta maneira b ∪ {x} ∈ w, donde
c ∈ w, isto é, P(c) é finito.
S
Proposição 10.12 Se c é finito e todo x ∈ c é finito, então c é finito
43
S
Demonstração: Considere w = {b : b ⊆ c ∧ f in( b)} (legitimado por [A2]). S
Claramente ∅ ∈ w. Seja b ∈ w e x ∈ c. Logo x é finito, por hipótese, e b é
finito, pela hipótese de indução (b ∈ w). É fácil provar que
[ [
(b ∪ {x}) = ( b) ∪ x
S
(exercı́cio). Portanto (b ∪ {x}) é finito, pela Proposição 10.4, e então b ∪ {x}
S ∈
w (claramente b ∪ {x} ⊆ c). Pelo Teorema 10.8 obtemos c ∈ w, isto é, c é
finito.
Proposição 10.13 Se P(c) é finito, então c é finito.

Demonstração: Seja b = {{x} : x ∈ c} (legitimado por [A2]). Como P(c) é
finito e b ⊆ P(c), então a Proposição 10.3(iii) assegura que b é finito. Como todo
elemento de Sb é da forma {x} (portanto finito)S então a Proposição 10.12 S nos
garante que b é finito. Mas é fácil provar que b = c. Com efeito: se y ∈ b,
então existe x ∈ c tal que y ∈ {x}, isto é, y = x dondeS y ∈ c. Reciprocamente,
se x ∈ c então x ∈ {x} onde {x} ∈ b, portanto x ∈ b. Logo, c é finito.
Proposição 10.14 (i) Se c é finito e c ≈ b então b é finito.

(ii) Se c é finito e b c então b é finito.
Demonstração: (i) Seja f uma bijeção de c em b. Como c é finito então im(f )
é finito, pela Proposição 10.10. Mas im(f ) = b.
(ii) Se b c, então b ≈ a onde a ⊆ c. Se c é finito, então a é finito. Logo a ≈ b
e a é finito, donde b é finito, pelo item (i).
A Lei de Tricotomia estabelece: para todo par de conjuntos c,b, temos que vale
uma e só uma das seguinte possibilidades: c ≺ b, b ≺ c, ou c ≈ b. Pode ser
provado que a Tricotomia equivale ao Axioma da Escolha. Porém, se um dos
conjuntos é finito, não precisamos de [AE] para provar esta propriedade.
Proposição 10.15 Se c é finito então c ≺ b, b ≺ c, ou c ≈ b.
Demonstração: Faremos indução sobre os subconjuntos de c. Dado b, con-
sidere
w = {a : a ⊆ c ∧ ((a ≺ b) ∨ (b ≺ a) ∨ (a ≈ b))}.
Claramente ∅ ∈ w pois, se b = ∅, então ∅ ≈ b e, se b 6= ∅, então ∅ ≺ b. Seja
a ∈ w e x ∈ c; queremos provar que a ∪ {x} ∈ w. O caso em que x ∈ a é óbvio.
Assumamos que x 6∈ a. Como a ∈ w, então temos três casos:
Caso 1: a ≺ b. Logo, existe y ∈ b − im(f ), onde f é uma função injetora de a
em b. Portanto, g = f ∪ {hx, yi} é uma função injetora de a ∪ {x} em b, donde
a∪{x} b. Daqui inferimos a∪{x} ≺ b ou a∪{x} ≈ b, pela Proposição 9.14(iv).
Nos dois casos, a ∪ {x} ∈ w.
Caso 2: b ≺ a. Como a a ∪ {x}, então b ≺ a ∪ {x}, pela Proposição 9.14(iii).
Portanto a ∪ {x} ∈ w.
Caso 3: b ≈ a. Como a ⊆ a∪{x}, então a ≈ a∪{x} ou a ≺ a∪{x}. No primeiro
caso b ≈ a ∪ {x}; no segundo caso b ≺ a ∪ {x}. Nos dois casos a ∪ {x} ∈ w.
Em virtude do Teorema 10.8, c ∈ w, isto é, c ≺ b, b ≺ c, ou c ≈ b.
44
Corolário 10.16 Se c é finito e b não é finito, então c ≺ b.
Demonstração: Temos que c ≺ b, b ≺ c ou c ≈ b. Os dois últimos casos

implicam a existência de uma bijeção f de a ⊆ c em b. Mas a é finito, portanto
b = im(f ) é finito, o que contradiz a hipótese. Logo, só pode ser c ≺ b.
Provaremos agora que um conjunto finito (no sentido Tarski) é um conjunto

finito (no sentido Dedekind). Como mencionamos anteriormente, toda prova
conhecida da afirmação recı́proca precisa do [AE].
Definição 10.17 Dedf in(c) denota ¬(∃b)(b ⊂ c ∧ c ≈ b)

(“c é Dedekind-finito se não é equipolente com nenhum subconjunto próprio”).
Teorema 10.18 Se c é finito, então c é Dedekind-finito.
Demonstração: Seja c finito, e suponha que c não é Dedekind-finito. Logo,

existe b ⊂ c tal que c ≈ b (via uma bijeção f de c em b). Considere
u = {a : a ⊆ c ∧ f “a ⊂ a}.
Como c ⊆ c e f “c = b ⊂ c, então c ∈ u, logo u 6= ∅. Como c é finito e u ⊆ P(c)

é não vazio, existe um elemento minimal d em u. Dado que f “d ⊂ d e d é
minimal, então
(1) f “d 6∈ u.
Por outro lado f “d ⊂ d implica que existe x ∈ (d−f “d). Note que f “(f “d) ⊆ f “d.
Se f (x) ∈ f “(f “d), então f (x) = f (y) com y ∈ f “d. Mas f é injetora,
portanto f (x) = f (y) implica x = y, isto é, x ∈ f “d, uma contradição.
Logo f (x) ∈ f “d − f “(f “d), donde f “(f “d) ⊂ f “d. Daqui (e do fato de ter
f “d ⊂ d ⊆ c) inferimos f “d ∈ u, em contradição com (1). Portanto a suposição
inicial é falsa e então c é Dedekind-finito.
Proposição 10.19 Sejam c e b finitos.

(i) c × b é finito.
(ii) cb é finito.
Demonstração: (i) Sejam c e b finitos. Se c = ∅ ou b = ∅ então c × b = ∅ é

finito. Se c e b são não vazios, então
[
c×b= a, a = {c × {y} : y ∈ b}.
Dado que c ≈ c × {y}, então todo elemento de a é S finito. Claramente a ≈ b,

donde a é finito. Pela Proposição 10.12 o conjunto a é finito, isto é, c × b é
finito.
(ii) Temos que cb ⊆ P(b × c). Como b × c é finito, pelo item (i), então P(b × c)
é finito, donde cb é finito.
45
11 Axiomas Finais de ZF . O Axioma da Escolha
Para definir a noção de ordinal precisaremos de acrescentar axiomas adicionais
ao sistema S. A seguir completaremos a definição do sistema ZF , estudando as
conseqüências da incorporação dos mesmos. O primeiro axioma a ser incorpo-
rado ao nosso sistema atual é o Axioma da Infinidade, que assegura a existência
de un conjunto infinito.
Axioma da Infinidade:
[A6] (∃w)((∅ ∈ w) ∧ (∀x)(x ∈ w → x ∪ {x} ∈ w))
Por definição temos que ∅ ∈ w, portanto
{∅} = ∅ ∪ {∅} ∈ w;
{∅, {∅}} = {∅} ∪ {{∅}} ∈ w;
{∅, {∅}, {∅, {∅}}} = {∅, {∅}} ∪ {{∅, {∅}}} ∈ w; etc.
Dado que {x} e logo x ∪ {x} só aparece num nı́vel posterior ao nı́vel em que foi
criado x, então [A6] exige a existência de uma seqüência crescente infinita de
nı́veis na estrutura cumulativa de tipos, sendo que w aparece só depois de todos
esses nı́veis. Este axioma é a primeira tentativa de afirmar que os nı́veis não
têm fim. Portanto, esta afirmação pode ser aceita por alguns matemáticos e re-
jeitada por outros. É fundamental perceber que este axioma separa claramente
a Aritmética (que pode ser realizada sem assumir a existência de seqüências
infinitas) de outras disciplinas da Matemática avanzada, tais como Análise, que
fazem um uso essencial do Axioma da Infinidade.
A seguir introduziremos um axioma importantı́ssimo, o Axioma de Substi-
tuição. Não só obteremos o Axioma de Separação como um corolário, senão
que poderemos assegurar a existência de ordinais e cardinais transfinitos.
Axioma de Substituição: Seja ψ(x, y) uma fórmula com x e y livres, mas

onde b não ocorre livre (outras variáveis podem ocorrer livres em ψ). Seja z uma
variável nova, e F U Nψ a fórmula (∀x)(∀y)(∀z)(ψ(x, y) ∧ ψ(x, z) → (y = z)).
[A7] F U Nψ → (∃b)(∀y)(y ∈ b ↔ (∃x)(x ∈ a ∧ ψ(x, y)))
A hipótese F U Nψ indica que ψ define uma função parcial, isto é: para cada x,
existe no máximo um y tal que ψ(x, y). Assumindo F U Nψ , então [A7] assegura
que o termo s dado por
s = {y : (∃x)((x ∈ a) ∧ ψ(x, y))}
é legitimado; ele representa a imagem de a sob a função parcial definida por

ψ(x, y); se o termo r dado por
r = {hx, yi : ψ(x, y)}
46
é legitimado, então s é r“(a) = im(r|a). Dado que r não é necessariamente legi-
timado, devemos esperar que [A7] acrescente novos conjuntos. Observe que [A7]
é um esquema de axioma, definindo um axioma particular para cada fórmula
ψ. Ele afirma que, dado a, podemos substituir os seus elementos por outros
conjuntos, desde que coloquemos no máximo um conjunto para cada elemento
de a.
Em termos da teoria cumulativa de tipos, isto afirma que os nı́veis não têm
fim. De fato, é a afirmação mais forte em ZF nessa direção. Assim, [A7] afirma
que toda coleção de nı́veis colocados em correspondência com os elementos de
um conjunto pode ser considerada como completada, portanto existem nı́veis
superiores. Mais precisamente, seja f (x) o nı́vel em que aparece y tal que
ψ(x, y) (se não existir y então f (x) pode ser tomado como o primeiro nı́vel).
Logo, a coleção de nı́veis f (x) está em correspondência com os elementos de a,
portanto existe um nı́vel em que todos os y tais que ψ(x, y) para algum x ∈ a
já foram criados. Nesse nı́vel pode ser criado b = {y : (∃x)((x ∈ a) ∧ ψ(x, y))}.
Observe que [A7] fornece um axioma para cada fórmula ψ apropriada; isto
limita o poder de [A7], da mesma maneira que acontece con [A2]. Por outro
lado, [A2] é um caso particular de [A7]:
Proposição 11.1 Seja φ(x) uma fórmula em que x ocorre livre mas b não
ocorre livre. Logo,
[A7] ` (∃b)(∀x)(x ∈ b ↔ ((x ∈ a) ∧ φ(x))).
Em outras palavras, [A2] é implicado por [A7].
Demonstração: Seja y uma variável nova (isto é, y não ocorre em φ(x) e
y 6= b). Considere ψ(x, y) dada por
ψ(x, y) ≡def φ(x) ∧ (x = y).
Pelas regras da igualdade, provamos a fórmula
(∗) (∃x)((x ∈ a) ∧ ψ(x, y)) ↔ (y ∈ a) ∧ φ(y).
Por outro lado, é fácil provar que ψ(x, y) e ψ(x, z) implica y = z. Logo F U Nψ
donde, por [A7], inferimos que (∃b)(∀y)(y ∈ b ↔ (∃x)((x ∈ a) ∧ ψ(x, y)). Por
(∗) obtemos
(∃b)(∀y)(y ∈ b ↔ ((y ∈ a) ∧ φ(y))),
isto é, [A2].
Provaremos agora que o axioma [PR] pode ser deduzido dos axiomas [A3] e
[A7], conforme anunciado na Seção 2.
Proposição 11.2 [A3], [A7] ` [PR].
Demonstração: Primeiro obtemos o seguinte:
47
Fato 1: [A7] ` (∃c)(∀u)(u 6∈ c).
Com efeito, basta tomar ψc (x, y) ≡def (x 6= x) ∧ (x = y) em [A7], e a uma
variável qualquer (exercı́cio).
Fato 2: [A3], [A7] ` (∃d)(∀x)(x ∈ d ↔ (∀w)(w ∈ x → (∀u)(u 6∈ w)).
Com efeito, basta tomar c como no Fato 1 e depois aplicar [A3] no conjunto c,
obtendo o conjunto d com as propriedades requeridas (exercı́cio).
Fato 3: Dados a e b considere a fórmula
ψa,b (x, y) ≡def ((∀w)(w 6∈ x) ∧ y = a)

∨ ((∃w)(w ∈ x) ∧ (∀w)(w ∈ x → (∀u)(u 6∈ w)) ∧ y = b).
Então F U Nψa,b (exercı́cio).

Fato 4: Usando apenas lógica clássica temos que
(∃x)((∀w)(w ∈ x → (∀u)(u 6∈ w)) ∧ ψa,b (x, y)) ↔ (y = a ∨ y = b)
(exercı́cio).
Logo, pelo Fato 3 e por [A7] temos que
(∃z)(∀y)(y ∈ z ↔ (∃x)(x ∈ d ∧ ψa,b (x, y))).
Finalmente, tomando d como no Fato 2 obtemos, pelo Fato 4, que
(∃z)(∀y)(y ∈ z ↔ (y = a ∨ y = b)).
Definição 11.3 O sistema ZF da Teoria de Conjuntos consiste do axioma

[A1] junto com os axiomas [A3]-[A7]. 1
Uma vez que introduzimos a totalidade dos axiomas de TC, discutiremos o Ax-
ioma da Escolha ([AE]), que originou uma das principais discussões dentro da
Teoria de Conjuntos. O sistema obtido de ZF acrescentando [AE] é usualmente
denotado por ZFC. Uma possı́vel formulação de [AE] é a seguinte:
Axioma da Escolha:
[AE] ((∀x)(x ∈ z → x 6= ∅) ∧ (∀x)(∀y)(((x, y ∈ z) ∧ (x 6= y))

→ x ∩ y = ∅)) → (∃u)(∀x)(∃v)(x ∈ z → u ∩ x = {v})
Isto é: dado um conjunto z cujos elementos são não vazios e dois a dois disjuntos,
então existe um conjunto de escolhas u, que tem exatamente um membro em
comum com cada elemento de z. Observe que, embora u “escolha” um e-
lemento de cada membro de z, o axioma nada diz respeito à existência de um
procedimento efetivo para realizar esta escolha.
1
Dado que, pela Proposição 11.1 o axioma [A2] é derivável em ZF , continuaremos a utilizá-
lo no resto do texto, embora não seja parte da axiomática de ZF .
48
O caráter altamente não construtivo deste axioma foi alvo de crı́ticas por
parte das escolas matemáticas construtivistas. Porém, a quantidade de aplicações
fundamentais de [AE] dentro de TC como na Matemática em geral fazem de
[AE] um axioma praticamente imprescindı́vel. Em TC é necessário [AE], por
exemplo, para obter a Lei de Tricotomia para conjuntos. Existe uma série de
importantes resultados matemáticos relacionados com o Axioma de Escolha,
por exemplo: o Teorema de Hahn-Banach, o Teorema de Ideais Primos para
Álgebras de Boole, a existência de bases em espaços vetoriais, e o Teorema de
Tychonoff (o produto de espaços topológicos compactos é compacto). Estes
dois últimos resultados são de fato equivalentes a [AE], assim como os seguintes
Princı́pios:
Princı́pio da Boa Ordem: Todo conjunto admite uma boa ordem.
Lema de Zorn: Seja A um conjunto ordenado tal que todo subconjunto total-
mente ordenado (ou cadeia) B tem um limitante superior. Então, A tem um
elemento maximal.
A não-construtividade embutida em [AE] pode ser entendida através do
seguinte exemplo intuitivo, devido a Bertrand Russell:
Exemplo 11.4 Considere uma coleção z de pares de sapatos idênticos. Nesse

caso, é possı́vel escolher sem problemas um único elemento (sapato) de cada par
de sapatos de z, por exemplo através do algoritmo “pegue apenas os sapatos
que correspondam ao pé direito”. Por outro lado, se agora consideramos uma
coleção z 0 de pares de meias idênticas (não existindo nenhuma diferença entre
a meia do pé direito e a do pé esquerdo), não existe um método imaginável
que permita escolher apenas uma meia de cada par de z 0 . Porém, o Axioma da
Escolha garante que é possı́vel fazer isto!
12 Introdução aos Ordinais

Embora os axiomas de ZF não mencionam explicitamente a existência dos nı́veis
da teoria cumulativa de tipos, eles são fortes o suficiente como para permitir
a sua definição. Os ordinais permitirão indexar os nı́veis (além de ter muitas
outras aplicações).
Definição 12.1 (von Neumann) transi(x) denota

(∀y)(∀z)((y ∈ z) ∧ (z ∈ x) → (y ∈ x))
(“x é transitivo”);
conec(x) denota (∀y)(∀z)(y, z ∈ x → ((y ∈ z) ∨ (z ∈ y) ∨ (y = z)))
(“x é conectado com relação a ∈”);
ord(x) denota transi(x) ∧ conec(x)
(“x é um ordinal”);
x < y denota ord(x) ∧ ord(y) ∧ x ∈ y
(“x é um ordinal menor que y”);
x ≤ y denota ord(x) ∧ ord(y) ∧ (x < y ∨ x = y).
Teorema 12.2 Utilizando os axiomas [A1], [A2], [A4], [A5], [PR] provamos o
seguinte:
49
(i) Se x é ordinal e y ∈ x, então y é ordinal.
(ii) ∅ é ordinal.
(iii) Se x é ordinal, então x ∪ {x} é ordinal.
Demonstração: (i) Fixe um ordinal x, e y ∈ x. Sejam u, v ∈ y. Como x é

transitivo e y ∈ x, então u, v ∈ x. Como x é conectado com relação a ∈, então
u ∈ v ou v ∈ u ou u = v. Daqui y é conectado. Para provar que y é transitivo
devemos utilizar o axioma da regularidade. Sejam então u ∈ z, z ∈ y. Como
y ∈ x e x é transitivo, obtemos que u ∈ x. Logo, de conec(x) deduzimos: y ∈ u
ou y = u ou u ∈ y. Queremos eliminar as duas primeiras possibilidades.
Caso 1: y ∈ u. Temos então: u ∈ z, z ∈ y, y ∈ u. Considere a = {u, y, z}
Logo:
y ∈ u ∩ a, z ∈ y ∩ a, u ∈ z ∩ a.
Logo, a 6= ∅ não tem nenhum elemento disjunto com a, contrariando o axioma
da regularidade. Portanto, não podemos ter y ∈ u.
Caso 2: y = u. Temos então: u ∈ z, z ∈ y, y = u; isto é, y ∈ z, z ∈ y. Mas, na
Proposição 3.6(2) provamos que [A5] implica: ¬(a ∈ b ∧ b ∈ a). Portanto não
podemos ter y = u.
Assim u ∈ y, donde transi(y). Daqui y é ordinal.
(ii) Todas as hipóteses são falsas, logo ∅ é trivialmente um ordinal.
(iii) Seja y = x ∪ {x}. Observe que
(∗) z ∈ y sse z ∈ x ou z = x.
Para provar que y é transitivo sejam u ∈ z e z ∈ y; queremos obter u ∈ y. Por

(∗) temos dois casos a partir da hipótese z ∈ y:
Caso 1: z ∈ x. Logo u ∈ z, z ∈ x implica u ∈ x, pois transi(x). Daqui u ∈ y,
por (∗).
Caso 2: z = x. Logo u ∈ z, z = x implica u ∈ x. Portanto u ∈ y, por (∗).
Provamos assim transi(y). Para provar que y é conectado considere u ∈ y,
z ∈ y; queremos obter z ∈ u ou u ∈ z ou z = u. Por (∗) inferimos a partir de
u, z ∈ y:
Caso 1: u ∈ x.
Caso 1.1: z ∈ x. Daqui u ∈ x, z ∈ x implica z ∈ u ou u ∈ z ou z = u, pois
conec(x).
Caso 1.2: z = x. Logo u ∈ x, x = z implica u ∈ z, donde z ∈ u ou u ∈ z ou
z = u.
Caso 2: u = x.
Caso 2.1: z ∈ x. Daqui z ∈ x, x = u implica z ∈ u, logo z ∈ u ou u ∈ z ou
z = u.
Caso 2.2: z = x. Logo u = x, x = z implica u = z, portanto z ∈ u ou u ∈ z
ou z = u.
Provamos então que y é conectado, sendo portanto um ordinal.
Definição 12.3 Introduzimos a notação seguinte:

0 denota ∅;
50
1 denota {∅};
2 denota {∅, {∅}};
3 denota {∅, {∅}, {∅, {∅}}};
em geral, n denota {0, 1, 2, ..., n − 1};
x + 1 denota x ∪ {x} (o sucessor de x).
Podemos provar agora a lei de tricotomia para ordinais (não confundir com a lei
de tricotomia enunciada anteriormente!). Esta propriedade é de fundamental
importância.
Teorema 12.4 Se x e y são ordinais, então: x ∈ y ou y ∈ x ou x = y.
Demonstração: Provaremos primeiro o seguinte

Fato: Se x e y são ordinais e x ⊂ y, então x ∈ y.
Com efeito: Seja z = y − x. Logo z 6= ∅, portanto existe u ∈ z tal que u ∩ z = ∅,
pelo axioma da regularidade. Logo u ∈ y, u 6∈ x. Como u ∩ z = ∅, então v ∈ u
implica v 6∈ z, isto é, v 6∈ y ou v ∈ x ou, equivalentemente, (v ∈ y → v ∈ x). Ou
seja: v ∈ u implica (v ∈ y → v ∈ x). Como y é transitivo e u ∈ y, então v ∈ u
implica v ∈ y. Como também temos (v ∈ y → v ∈ x), então deduzimos v ∈ x.
Ou seja: v ∈ u implica v ∈ x, donde u ⊆ x. Por outro lado, seja w ∈ x; como
x ⊆ y, então w ∈ y. Dado que u ∈ y e y é conectado, então u = w ou u ∈ w
ou w ∈ u. Se u = w, então de w ∈ x inferimos u ∈ x, contradição (u ∈ y − x).
Se u ∈ w então: u ∈ w, w ∈ x implica u ∈ x (pois x é transitivo), contradição.
Portanto só podemos ter w ∈ u. Assim: w ∈ x implica w ∈ u, donde x ⊆ u.
Desta maneira u = x. Como u ∈ y, então x ∈ y, provando o Fato.
Sejam então x e y ordinais. É muito simples provar que z = x ∩ y é também
um ordinal (exercı́cio). Se z 6= x e z 6= y, então z ⊂ x e z ⊂ y, donde z ∈ x e
z ∈ y, pelo Fato. Daqui z ∈ x ∩ y, isto é, z ∈ z, contradição. Logo z = x ou
z = y. Se z = x, então x ⊆ y. Se x = y, vale a tricotomia. Se x ⊂ y, então
x ∈ y, pelo Fato, donde vale a tricotomia. O caso z = y é similar.
Corolário 12.5 (“Paradoxo” de Burali-Forti) O termo {x : ord(x)} não

é legitimado.
Demonstração: Suponha que definimos On = {x : ord(x)}. Provaremos

que On é um ordinal, portanto On ∈ On, uma contradição. Com efeito, pelo
Teorema 12.2(i) obtemos que On é transitivo. Pelo Teorema 12.4 inferimos que
On é conectado. Daqui ord(On).
Desde o ponto de vista da teoria cumulativa de tipos, esperamos ter só um

ordinal em cada nı́vel (isto será provado depois). Logo, On não poderia ser
jamais completado.
Definição 12.6 Usaremos as letras gregas α, β, γ, etc., eventualmente com

subı́ndices (mas não φ, ψ, as quais são reservadas para denotar fórmulas),
como variáveis para indicar ordinais. Além disso,
(∀α)φ(α) denotará (∀α)(ord(α) → φ(α));
(∃α)φ(α) denotará (∃α)(ord(α) ∧ φ(α)), e
51
{α : φ(α)} denotará {α : ord(α) ∧ φ(α)}.
A definição da quantificação (∀α) e (∃α) é correta, pois existem ordinais.
Definição 12.7 suc(x) denota ord(x) ∧ ((∃y)(x = y + 1) ∨ (x = 0))

(“x é zero ou um ordinal sucessor”);
lim(x) denota ord(x) ∧ ¬suc(x)
(“x é um ordinal limite”);
int(x) denota suc(x) ∧ (∀y)(y < x → suc(y))
(“x é um enteiro não negativo”).
Se x é um ordinal sucessor da forma x = y + 1, então y ∈ x, pela definição

de y + 1. Pelo Teorema 12.2(i), temos que y é também um ordinal. Portanto
y + 1 é um ordinal sse y é um ordinal. Não existe razão para considerar 0 como
sucessor ou limite, mas ele é incluido no conjunto dos sucessores. Observe que
vale a seguinte propriedade:
[LIM] lim(x) ↔ ord(x) ∧ (x 6= 0) ∧ (∀y)(y ∈ x → y + 1 ∈ x).
Com efeito, lim(x) implica ord(x) e ¬ord(x) ∨ (¬(∃y)(x = y + 1) ∧ x 6= 0). Logo

ord(x), x 6= 0 e (∀y)(x 6= y + 1). Seja y ∈ x; como ord(y), então ord(y + 1)
donde, por tricotomia, y + 1 < x ou y + 1 = x ou x < y + 1. Não podemos ter
x = y+1. Por outro lado, x < y+1 implica: x = y (portanto x ∈ x, contradição)
ou x ∈ y (portanto x ∈ y e y ∈ x, contradição). Logo y +1 < x, isto é, y +1 ∈ x.
Reciprocamente, suponha ord(x), x 6= 0, (∀y)(y ∈ x → y + 1 ∈ x). Se x = y + 1,
então y ∈ x, donde y + 1 ∈ x, isto é, x ∈ x, contradição. Logo x 6= y + 1 para
todo y donde x é ordinal limite.
Provaremos que um princı́pio fraco de indução matemática para os inteiros é
válido no sistema S (lembre da Definição 3.5).
Teorema 12.8 (Indução Matemática) Para cada fórmula ψ da linguagem
de ZF, temos que:
S ` (ψ(0) ∧ (∀α)(ψ(α) → ψ(α + 1))) → (∀α)(int(α) → ψ(α)).
Demonstração: Suponhamos que a conclusão do princı́pio de indução é falsa;

provaremos que a hipótese é falsa. Assim, assumamos que existe um ordinal
β tal que int(β) ∧ ¬ψ(β). Observe que, dados ordinais γ e β, então γ ≤ β sse
γ = β ou γ ∈ β sse γ ∈ β + 1. Portanto, por [A2] podemos criar o conjunto
y = {γ : γ ≤ β ∧ ¬ψ(γ)} = {γ : (γ ∈ β + 1) ∧ ¬ψ(γ)}.
Por outro lado y 6= ∅, pois β ∈ y. Pelo axioma da regularidade existe γ0 ∈ y tal

que γ0 ∩ y = ∅. Dado que γ0 ≤ β e int(β), então suc(γ0 ). Com efeito: γ0 = β
implica int(γ0 ), logo suc(γ0 ). Por outro lado, γ0 < β implica suc(γ0 ), pela
definição de int(β). Dado que suc(γ0 ), então
Caso 1: γ0 = 0. Daqui ¬ψ(0), pois γ0 ∈ y.
Caso 2: γ0 = γ1 +1 para algum γ1 (que resulta ser um ordinal, pela observação
após a Definição 12.7). Como γ1 ∈ γ0 e γ0 ∩ y = ∅, então γ1 6∈ y. Daqui ψ(γ1 ),
pois γ1 ≤ β. Isto é: ψ(γ1 ) ∧ ¬ψ(γ1 + 1).
52
Vemos que cualquer dos casos acima contraria a hipótese do princı́pio de indução.

O princı́pio de indução 12.8 é mais fraco do que a indução utilizada freqüente-

mente em matemáticas, pois 12.8 é restrito às propriedades dos inteiros que po-
dem ser expressadas mediante fórmulas da linguagem. O conjunto das fórmulas
é enumerável, enquanto que o conjunto das propriedades dos inteiros positivos
é o conjunto P(N), que não é enumerável.
Queremos provar que a coleção dos inteiros é um conjunto. Isto será provado
a partir do axioma do infinito (de fato, o seguinte teorema é equivalente a [A6]).
Teorema 12.9 Seja Z o sistema composto dos axiomas [A1]-[A6] mais [PR],
isto é, Z é obtido de ZF substituindo o axioma de substituição [A7] pelos a-
xiomas [A2] e [PR]. Logo
Z ` (∃y)(∀z)(z ∈ y ↔ int(z)).
Demonstração: Pelo axioma [A6] existe um conjunto w tal que 0 ∈ w e se

x ∈ w então x + 1 ∈ w. Considere a fórmula ψ(x) dada por x ∈ w. Por indução
matemática obtemos:
(∀x)(int(x) → x ∈ w).
Portanto inferimos que int(x) sse (x ∈ w) ∧ int(x) para todo x. Por otro lado,
de [A2] deduzimos
(∃y)(∀x)(x ∈ y ↔ ((x ∈ w) ∧ int(x))).
Isto significa que existe y = {x : (x ∈ w) ∧ int(x)} = {x : int(x)}.
Definição 12.10 ω denota {z : int(z)}

(o conjunto dos inteiros não negativos).
Teorema 12.11 (i) Z ` ord(ω).

(ii) Z ` lim(ω).
Demonstração: (i) Considere y ∈ x e x ∈ ω. Logo y ∈ x e int(x); daqui y

é um ordinal (pois y ∈ x e x é um ordinal), e y < x. Logo suc(y). Se z ∈ y,
então z ∈ x, logo suc(z). Daqui int(y), isto é, y ∈ ω. Isto prova que ω é
transitivo. Sejam agora x, y ∈ ω. Logo ord(x) e ord(y). Pela lei de tricotomia
para ordinais obtemos x ∈ y ou y ∈ x ou x = y. Isto prova que ω é conectado
para ∈.
(ii) Observe que ω 6= 0, pois 0 ∈ ω. Além disso ω é um ordinal, por (i).
Claramente
(∀y)(int(y) → int(y + 1)),
isto é, (∀y)(y ∈ ω → (y + 1 ∈ ω)). Pela propriedade [LIM] obtemos que ω é um
ordinal limite.
53
13 Indução e Recursão Transfinita
Introduziremos a seguir a importante noção de fecho transitivo de um conjunto,
que será utilizada para provar que a relação de pertinência ∈ é bem fundada.
O fato de ∈ ser bem fundada permitirá a introdução de definições e demon-
strações por recursão transfinita em ZF, uma poderosa ferramenta na teoria de
conjuntos.
Definição 13.1 F T (x) denota {y : (∀z)(x ∈ z ∧ transi(z) → y ∈ z)}

(“F T (x) é o fecho transitivo de x”).
Por definição, F T (x) é o menor conjunto transitivo z tal que x ∈ z, isto é, F T (x)
é a interseção de todos os conjuntos transitivos z tais que x ∈ z. Ele é formado
intuitivamente da maneira seguinte: dado x, procuramos nos nı́veis anteriores
os elementos y de x, e recomeçamos o processo, isto é, procuramos os elementos
z de y, e depois os elementos w de z etc., obtendo o “histórico” de x através
destas componentes. É claro que precisamos provar a existência de F T (x)
para todo x. Ela é garantida pelos axiomas da infinidade e da substituição.
Enunciamos este resultado, omitindo a demonstração.
Teorema 13.2 Em ZF o termo F T (x) é legitimado, isto é:
Z ` (∀x)(∃w)(∀y)(y ∈ w ↔ (∀z)(x ∈ z ∧ transi(z) → y ∈ z)).
Podemos agora definir a classe de fórmulas a partir das quais podemos fazer
indução, isto é, as fórmulas ψ(x, y) que expressam relações bem fundadas.
Definição 13.3 Seja φ(x, y) uma fórmula onde x e y ocorrem livres. BF (φ)
denota
(∀x)((x 6= ∅ → (∃v)(v ∈ x ∧ (∀z)(z ∈ x → ¬φ(z, v))))∧
∧(∃u)(x ⊆ u ∧ (∀w, y)(y ∈ u ∧ φ(w, y) → w ∈ u)))
(“a relação φ(x, y) é bem fundada”).
A primeira parte da fórmula anterior afirma que todo conjunto não vazio deve
ter um elemento φ-minimal; intuitivamente, não temos φ-ciclos nem φ-cadeias
descendentes infinitas, isto é: não podemos ter φ(x, x1 ), φ(x1 , x2 ), ..., φ(xn , x)
nem
φ(x1 , x), φ(x2 , x1 ), φ(x3 , x2 ), . . . , φ(xn , xn−1 ), . . . .
A segunda parte afirma que todo conjunto pode ser estendido a um conjunto
u que é φ-fechado, isto é: todo conjunto φ-relacionado com um membro de u
deve pertencer a u.
Proposição 13.4 Em ZF provamos que as relações x < y e x ∈ y são bem

fundadas.
Demonstração: Nas duas relações, a primeira parte é uma conseqüência direta

do axioma da regularidade. A segunda parte segue do Teorema 13.2, tomando
u como sendo F T (x). Com efeito: seja y ∈ x; se x ∈ z e z é transitivo, então
y ∈ z. Logo y ∈ F T (x), donde x ⊆ F T (x). Se y ∈ F T (x) e w ∈ y, considere z
54
transitivo tal que x ∈ z. Logo y ∈ z, donde w ∈ z, pois z é transitivo. Daqui
w ∈ F T (x), portanto F T (x) satisfaz as condições requeridas.
Podemos agora legitimar a noção de prova por φ-indução transfinita, assumindo

que φ é bem fundada. Assim, para provar que (∀y)ψ(y) basta assumir a ver-
dade de ψ(z) para todos os φ-antecessores z de y. A hipótese de indução é
(∀z)(φ(z, y) → ψ(z)).
Teorema 13.5 (Indução Transfinita) Em S provamos o seguinte:
[BF (φ) ∧ (∀y)((∀z)(φ(z, y) → ψ(z)) → ψ(y))] → (∀y)ψ(y).
Demonstração: Suponha que (∀y)ψ(y) é falsa e BF (φ) é verdadeira. Encon-

traremos v0 tal que
(1) (∀z)(φ(z, v0 ) → ψ(z)) ∧ ¬ψ(v0 ),
contrariando a hipótese do teorema. Seja então v tal que ¬ψ(v); ele existe,
pela suposição ¬(∀y)ψ(y). Como BF (φ), podemos estender {v} a um conjunto
φ-fechado u, isto é:
(2) (v ∈ u) ∧ (z ∈ u ∧ φ(w, z) → w ∈ u).
Considere u0 = {z : (z ∈ u) ∧ ¬ψ(z)}, legitimado por [A2]. Como v ∈ u, então

v ∈ u0 , portanto u0 6= ∅. Pela primeira parte de BF (φ) existe um elemento
v0 de u0 que é φ-minimal. Logo, fixe z tal que φ(z, v0 ); isto implica z 6∈ u0 ,
pois v0 é φ-minimal em u0 , portanto z 6∈ u ou ψ(z). Dado que v0 ∈ u (pois
v0 ∈ u0 ) e φ(z, v0 ), então z ∈ u, por (2). Daqui ψ(z), provando desta maneira:
φ(z, v0 ) → ψ(z) para todo z. Como v0 ∈ u0 , então ¬ψ(v0 ). Desta maneira
provamos (1) como queriamos.
As provas por indução transfinita são importantes, mas são mais úteis quando
combinadas com a definição por recursão transfinita. Suponha que queremos
definir a soma de ordinais de maneira a ter
α + 0 = α;
(∗) α + (β + S
1) = (α + β) + 1;
α + λ = δ<λ (α + δ) se λ é um ordinal limite.
S
Embora +1 e sejam operações conhecidas, vemos que a segunda e a terceira
cláusula de (∗) utilizam + nos dois lados da definição. Usualmente este tipo de
definição circular seria rejeitada. Porém, devemos observar que os ordinais do
lado direito utilizam + em ordinais menores aos do lado esquerdo (o membro
a ser definido). Podemos pensar que, fixado α, definimos sucessivamente α + β
para ordinais β cada vez maiores, utilizando os valores α + γ com γ < β. O
Teorema da Definição por Recursão Transfinita estabelece que, partindo de uma
relação φ(x, y) bem fundada, então podem ser realizadas este tipo de definições
55
que utilizam os φ-antecessores, e a definição é única. Ou seja, podemos definir
novas operações por indução sobre uma relação bem fundada. Observe que
a definição (∗), embora consista de varias cláusulas, elas podem ser juntadas
numa só cláusula mediante disjunção de conjunções. Assim uma definição pode
ser pensada como sendo introduzida por uma fórmula. Isto coincide com a idéia
→ →
de definição de funções por recursão: se h( x ) e g(x, y; x ) são funções recursi-
vas de números naturais, então podemos definir por recursão sobre x a função
→ →
f (x; x ) (onde x consiste de parâmetros) da maneira seguinte:
→ →
f (0; x ) = h( x );
→ → →
f (x + 1; x ) = g(f (x; x ), x; x ).
Desta maneira f é definida a partir de g, que utiliza o valor anterior de f .

Definiremos um análogo (mais geral) para TC, onde agora g utilizará todos os
valores anteriores de f .
Definição 13.6 Seja G(x1 , ..., xn , y) uma fórmula com ao menos x1 ,..., xn , y
livres. Definimos
G0 hx1 , ..., xn i = {z : (∃y)((∀w)(G(x1 , ..., xn , w) ↔ y = w) ∧ (z ∈ y))}.
Isto é, G0 hx1 , ..., xn i é o único y tal que G(x1 , ..., xn , y) (se existir), ou ∅ em caso
contrário. Logo G0 hx1 , ..., xn i é sempre um conjunto.
Definição 13.7 Seja F (x1 , ..., xn , y) uma fórmula com ao menos x1 , ..., xn , y
livres, e φ(u, v) com u, v livres. Definimos
AN T (F, x1 , ..., xn , φ(u, v)) = {hhz, x2 , x3 , ..., xn i, F 0 hz, x2 , ..., xn ii : φ(z, x1 )}.
O termo AN T (F, x1 , ..., xn , φ(u, v)) define o conjunto dos valores de F prévios
a x1 (a variável de recursão).
Lema 13.8 Se φ(u, v) é bem fundada, então AN T (F, x1 , ..., xn , φ(u, v)) é le-
gitimado em ZF.
Estabeleceremos a seguir o teorema de recursão transfinita. A partir de agora
G(x, x1 , ...., xn , y) é uma fórmula definindo uma operação que é iterada na
variável x1 , com x2 ,..., xn como parâmetros para definir uma operação y =
F 0 hx1 , ...., xn i. Em AN T (F, x1 , ..., xn , φ(u, v)) estão disponı́veis os valores an-
teriores de F , e permanecem no primeiro lugar de G na iteração, da mesma
maneira que é feito na definição da função recursiva
→ → →
f (x + 1; x ) = g(f (x; x ), x; x ).
Teorema 13.9 (Recursão Transfinita) Sejam G(x, x1 , ..., xn , y) e φ(u, v)

fórmulas. Então existe uma fórmula F (x1 , ..., xn , y) tal que
BF (φ(u, v)) → (∀x1 )[(∃!y)F (x1 , ..., xn , y) ∧ (∀y)(F (x1 , ..., xn , y) ↔

↔ y = G0 hAN T (F, x1 , ..., xn , φ(u, v)), x1 , x2 , ..., xn i)]
é demonstrável em ZF.
56
Veremos a seguir dois exemplos de aplicação do princı́pio de definição por re-
cursão transfinita: a função de posto e a hierarquia cumulativa de von Neumann.
S
Definição 13.10 ρ(x) = {ρ(y) + 1 : y ∈ x}
(“ρ(x) é o posto de x”).
Proposição 13.11 Em ZF provamos o seguinte:

(i) ρ(x) é definido para todo conjunto x.
(ii) ρ(x) é um ordinal para todo conjunto x.
(iii) Se α é um ordinal, então ρ(α) = α.
(iv) se x ∈ y, então ρ(x) < ρ(y).
Demonstração: (i) Usaremos o principio de recursão transfinita. Para isto,

considere φ(u, v) como sendo u ∈ v; logo, a relação φ (isto é, a relação ∈) é bem
fundada, pela Proposição 13.4. Seja G(X, x1 , y) a fórmula
[
G(X, x1 , y) ≡def (x1 = x1 ) ∧ (y = {w + 1 : w ∈ im(X)}).
Logo, a operação F (x, y) definida no Teorema 13.9 satisfaz:

[
F 0 hxi = G0 hAN T (F, x, ∈), xi = {w + 1 : w ∈ im(AN T (F, x, ∈))}.
Por outro lado:

AN T (F, x, ∈) = {hz, F 0 hzii : z ∈ x}
donde im(AN T (F, x, ∈)) = {F 0 hzi : z ∈ x}. Daqui
[
F 0 hxi = {F 0 hzi + 1 : z ∈ x}.
Isto significa que a operação F é a função posto.

(ii) Considere a fórmula ψ(x) dada por ord(ρ(x)). Provaremos por indução
transfinita sobre a relação ∈ que ψ(x) é verdadeira para todo x. Assim fixemos
y, e suponhamos que
(∀z)(z ∈ y → ord(ρ(z))
(a hipótese de indução) é verdadeira. Queremos provar que ρ(y) éSum ordinal.
Se z ∈ y, então ord(ρ(z)), logo ord(ρ(z) + 1). Além disso, ρ(y) = {ρ(z) + 1 :
z ∈ y}, logo x ∈ ρ(y) sse existe z ∈ y tal que x ∈ ρ(z) + 1. Sejam então x ∈ ρ(y)
e w ∈ x; logo w ∈ x e x ∈ ρ(z) + 1 para algum z ∈ y, e ρ(z) + 1 é um ordinal
(portanto é transitivo). Daqui w ∈ ρ(z) + 1 e então w ∈ ρ(y). Logo, ρ(y) é
transitivo. Se u, v ∈ ρ(y), então u ∈ ρ(z) + 1 e v ∈ ρ(z 0 ) + 1 para z, z 0 ∈ y.
Dado que ρ(z) + 1 e ρ(z 0 ) + 1 são ordinais, então u e v são ordinais, portanto
u ∈ v ou v ∈ u ou u = v, pela lei de tricotomia para ordinais. Daqui ρ(y) é
conectado, sendo portanto um ordinal.
(iii) Considere ψ(x) a fórmula (ord(x) → x = ρ(x)). Provaremos por indução
transfinita sobre a relação bem fundada < que ψ(x) vale para todo x. As-
sumamos então, fixado y, a hipótese de indução (∀z)(z < y → ψ(z)), isto é,
(∀z)[(ord(z) ∧ ord(y) ∧ z ∈ y) → (ord(z) → z = ρ(z))]
57
ou, equivalentemente,
(∗) (∀z)[(ord(y) ∧ ord(z) ∧ z ∈ y) → z = ρ(z)].
Queremos provar que (ord(y) → y = ρ(y)). Suponha então que y é um ordinal.

Logo, se z ∈ y então z é um ordinal, e vale a hipótese de (∗) para z, portanto
z = ρ(z). Daqui
[ [
ρ(y) = {ρ(z) + 1 : z ∈ y} = {z + 1 : z ∈ y}.
Seja x ∈ ρ(y); logo x ∈ z + 1 para algum z ∈ y. Temos dois casos:

(a) x ∈ z. Logo x ∈ z, z ∈ y implica x ∈ y (pois y é um ordinal portanto é
transitivo).
(b) x = z. Logo x = z, z ∈ y implica x ∈ y.
Vemos que em todos os casos x ∈ ρ(y) implica x ∈ y, donde ρ(y) ⊆ y. Suponha
agora que x ∈ y; logo x ∈ x + 1 tal que x ∈ y, donde x ∈ ρ(y). Isto é, y ⊆ ρ(y),
portanto y = ρ(y) como queriamos provar. S
(iv) Seja x ∈ y. Como ρ(x) ∈ ρ(x) + 1 e x ∈ y, então ρ(x) ∈ {ρ(z) + 1 : z ∈
y} = ρ(y). Dado que ρ(x) e ρ(y) são ordinais, pelo item (ii), então inferimos
que ρ(x) < ρ(y).
Definição 13.12 A Hierarchia Cumulativa de von Neumann é definida da

maneira seguinte:
[ [
Vα = P(Vβ ) = {P(Vβ ) : β < α}.
β<α
Exemplo 13.13 Aplicando a definição acima temos que

S S
V0 = S{P(Vβ ) : β < 0} = S ∅ = ∅; S S
V1 = S{P(Vβ ) : β < 1} = S{P(V0 )} = {P(∅)} S = {{∅}} = {∅};
V2 = {P(Vβ ) : β < 2} = {P(V0 ), P(V1 )} = {{∅}, {∅, {∅}}}
=S{∅, {∅}}; S
V3 = S{P(Vβ ) : β < 3} = {P(V0 ), P(V1 ), P(V2 )}
= {{∅}, {∅, {∅}}, {∅, {∅}, {{∅}}, {∅, {∅}}}} = {∅, {∅}, {{∅}}, {∅, {∅}}}.

Teorema 13.14 Em ZF provamos o seguinte:

(i) Vα é definido para todos os ordinais α.
(ii) Seja α um ordinal. Logo Vα é transitivo,
S e Vα+1 = P(Vα ).
(iii) Seja λ um ordinal limite. Logo Vλ = β<λ Vβ .
(iv) Seja α um ordinal. Então x ∈ Vα sse ρ(x) < α.
(v) (∀x)(∃α)(x ∈ Vα ) (aqui, α denota um ordinal).
Demonstração: (i) Aplicaremos o principio de recursão transfinita 13.9. Con-

sidere a fórmula
[
G(X, x1 , y) ≡def (x1 = x1 ) ∧ (y = {P(w) : w ∈ im(X)}).
58
A operação F (x, y) definida por recursão transfinita sobre ∈ a partir de G
satisfaz o seguinte:
[
F 0 hxi = {P(w) : w ∈ im(AN T (F, x, ∈))}.
Mas im(AN T (F, x, ∈)) = {F 0 hyi : y ∈ x}, logo

[
F 0 hxi = {P(F 0 hyi) : y ∈ x}.
Se α é um ordinal, então β < α sse β ∈ α, logo F 0 hαi representa Vα sobre os

ordinais α, isto é, Vα está legitimado para todo ordinal α.
(ii) Faremos indução transfinita sobre a relação < e a seguinte fórmula:
ψ(x) ≡def ord(x) → (transi(Vx ) ∧ Vx+1 ⊆ P(Vx )).
Fixado um ordinal y, assuma que a hipótese de indução é verdadeira, isto é,

(∀z)(z < y → ψ(z)) ou, equivalentemente,
(∗) (∀z)(z ∈ y → (transi(Vz ) ∧ Vz+1 ⊆ P(Vz )))
(pois, se y é ordinal, então z < y sse z ∈ y). Queremos provar que Vy é transi-
tivo e Vy+1 ⊆ P(Vy ). Pela definição de Vy temos que
(∗∗) x ∈ Vy sse x ∈ P(Vz ) para algum z ∈ y sse x ⊆ Vz para algum z ∈ y.
Fato 1: Seja u transitivo e w ∈ u. Logo w ⊆ u.

Com efeito, se z ∈ w, então: z ∈ w, w ∈ u, transi(u) implica z ∈ u, isto é:
z ∈ w implica z ∈ u. Daqui w ⊆ u, provando o Fato 1.
Seja então x ∈ Vy e w ∈ x. Por (∗∗) temos que x ⊆ Vz para algum z ∈ y.
Dado que w ∈ x, então w ∈ Vz . Por (∗) temos que Vz é transitivo, e w ∈ Vz ,
logo w ⊆ Vz , pelo Fato 1. Portanto w ∈ Vy , por (∗∗). Isto significa que Vy é
transitivo se y é um ordinal. Falta provar que Vy+1 ⊆ P(Vy ). Por (∗) temos que
Vz+1 ⊆ P(Vz ) para todo z ∈ y, logo Vz+1 = P(Vz ) para todo z ∈ y (a inclusão
P(Vz ) ⊆ Vz+1 é imediata da Definição 13.12). Logo
S S
Vy+1 = S{P(Vz ) : z ∈ y + 1} = ({P(Vz ) : z ∈ y} ∪ {P(Vy )})
= ({Vz+1 : z ∈ y} ∪ {P(Vy )}).
SejaSx ∈ Vy+1 ; logo x ∈ u tal que u ∈ {Vz+1 : z ∈ y} ∪ {P(Vy )}, pela definição
de . Temos dois casos:
(a) u = P(Vy ). Logo, x ∈ P(Vy ).
(b) u = Vz+1 para algum z ∈ y. Provaremos primeiro o seguinte
Fato 2: Se α e β são ordinais, então α < β + 1 implica Vα ⊆ Vβ .
Com efeito, se α < β, então: γ ∈ α implica γ ∈ β. Logo, se w ∈ Vα , então
w ∈ P(Vγ ) para algum γ ∈ α, pela Definição 13.12. Daqui w ∈ P(Vγ ) onde
γ ∈ β, portanto w ∈ Vβ , isto é, Vα ⊆ Vβ . O caso α = β é óbvio. Isto prova o
Fato 2.
59
Continuando com o caso (b), temos que x ∈ u = Vz+1 , onde z ∈ y. Logo existe
w ∈ z + 1 tal que x ∈ P(Vw ), pela Definição 13.12. Mas w ∈ z + 1, z ∈ y implica
w ∈ y, pois y é ordinal. Daqui w < y + 1 e então Vw ⊆ Vy , pelo Fato 2. Dado
que x ∈ P(Vw ), então x ⊆ Vw , donde x ⊆ Vy , isto é, x ∈ P(Vy ).
Vemos que os dois casos (a) e (b) nos levam à conclusão de que x ∈ P(Vy ).
Portanto Vy+1 ⊆ P(Vy ). Desta maneira provamos ψ(y) a partir da hipótese de
indução. Logo, ψ(x) vale para todo x, isto é: Vα é transitivo e Vα+1 = P(Vα ),
se α é um ordinal.
(iii) Seja λ um ordinal limite. Por (ii) temos que
[ [
Vλ = {P(Vβ ) : β < λ} = {Vβ+1 : β < λ}.
Se β < λ então β + 1 < λ, por [LIM], donde Vβ ⊆ Vλ e Vβ+1 ⊆ Vλ , pelo Fato

2. Portanto Vβ ∈ P(Vλ ) e Vβ+1 ∈ P(Vλ ). Isto significa que existem os conjuntos
a = {Vβ : β < λ} = {x : x ∈ P(Vλ ) ∧ (∃β)(β < λ ∧ x = Vβ )},
b = {Vβ+1 : β < λ} = {x : x ∈ P(Vλ ) ∧ (∃β)(β < λ ∧ x = Vβ+1 )}.

S S
Dado que β < λ implica Vβ ⊆ Vλ , então a ⊆ Vλ , pela definição de
S . S Por
S β < λ implica β + 1 < λ então b ⊆ a, donde Vλ = b ⊆ a,
outro lado, como
isto é, Vλ = a como queriamos.
(iv) Considere ψ(x) ≡def (∀α)(x ∈ Vα ↔ ρ(x) < α) (aqui, α é uma variável de
ordinais). Provaremos por indução sobre ∈ que ψ(x) vale para todo x. Seja y,
e suponhamos que
(HI) (∀z)(z ∈ y → ψ(z)).
Queremos provar que vale ψ(y). Fixemos então um ordinal α.

Parte 1: (y ∈ Vα → ρ(y) < α).
Assumamos que y ∈ Vα . Se z ∈ y, então z ∈ Vα , pois Vα é transitivo por (ii).
Por (HI) temos que ρ(z) < α, portanto ρ(z) + 1 ≤ α. Suponha que existe z ∈ y
tal que α = ρ(z) + 1. Logo, por (ii)
y ∈ Vα = Vρ(z)+1 = P(Vρ(z) ).
Daqui y ⊆ Vρ(z) ; mas z ∈ y, logo z ∈ Vρ(z) , e ρ(z) é um ordinal. Por (HI)

obtemos que ρ(z) < ρ(z), uma contradição. Logo ρ(z) + 1 < α para todo z ∈ y.
Portanto [
ρ(y) = {ρ(z) + 1 : z ∈ y} ⊆ α
donde ρ(y) ≤ α. Suponha que α = ρ(y). Dado que y ∈ Vα , então existe β ∈ α
tal que y ∈ P(Vβ ), pela Definição 13.12. Dado que β ∈ α = ρ(y), então existe
z ∈ y tal que β ∈ ρ(z)+1. Mas y ∈ P(Vβ ), então y ⊆ Vβ , e z ∈ y, donde z ∈ Vβ .
Por (HI) temos que ρ(z) < β. Por outro lado provamos que β ∈ ρ(z) + 1, e
então temos dois casos:
(a) β ∈ ρ(z): logo β ∈ ρ(z) e ρ(z) ∈ β, contradição.
60
(b) β = ρ(z): logo ρ(z) ∈ β e β = ρ(z), contradição.
Os dois casos nos levam a uma contradição, portanto ρ(y) < α. Isto conclui a
prova da Parte 1.
Parte 2: (ρ(y) < α → y ∈ Vα ).
Assumamos que [
ρ(y) = {ρ(z) + 1 : z ∈ y} < α.
S S
Suponha que y 6∈ Vα = {P(Vβ ) : β < α}. Aplicando a definição de
obtemos:
(∗ ∗ ∗) para todo β < α existe z ∈ y tal que z 6∈ Vβ
pois y 6∈ P(Vβ ) sse y 6⊆ Vβ . Por hipótese ρ(y) < α donde, por (∗∗∗), existe z ∈ y
tal que z 6∈ Vρ(y) . Dado que z ∈ y e ρ(z) < ρ(z) + 1 então, por (HI), temos que
z ∈ Vρ(z)+1 . Mas z ∈ y implica ρ(z) < ρ(y), pela Proposição 13.11(iv). Logo
ρ(z)+1 < ρ(y)+1, donde Vρ(z)+1 ⊆ Vρ(y) , pelo Fato 2. De z ∈ Vρ(z)+1 obtemos
z ∈ Vρ(y) , uma contradição. Portanto y ∈ Vα . Provamos desta maneira a Parte
2, obtendo portanto ψ(y). Por indução transfinita temos que ψ(x) vale para
todo x.
(v) Dado x, então ρ(x) é um ordinal, portanto ρ(x) + 1 é também um ordinal,
e ρ(x) < ρ(x) + 1. Pelo item (iv) inferimos que x ∈ Vρ(x)+1 .
O teorema anterior é a afirmação mais forte que podemos fazer em ZF com

relação à teoria cumulativa de tipos. Provamos desta maneira que os objetos
que estudamos na linguagem (reprsentados pelas variáveis livres) pertencem de
fato a uma estrutura cumulativa. O ordinal ρ(x)+1 indica o nı́vel da hierarquia
em que o conjunto x aparece pela primeira vez; portanto o seu posto ρ(x) de-
nota exatamente o nı́vel em que ele é concebido. Por outro lado, Vα é a coleção
de todos os conjuntos que apareceram antes do nı́vel α. Logo Vα+1 −Vα consiste
dos conjuntos criados no nı́vel α. O fato que ρ(x) + 1 = M in{β : x ∈ Vβ } é
fácil de ser provado. Com efeito:
(a) ρ(x) < ρ(x) + 1 implica x ∈ Vρ(x)+1 ;

(b) x ∈ Vβ implica ρ(x) < β implica ρ(x) + 1 ≤ β.
Assim, 0 aparece no nı́vel 1 (pois o nı́vel 0 é vazio); 1 é concebido no nı́vel 1 (isto

é, ρ(1) = 1 ' 1), logo só aparece no nı́vel 2; em geral, n é concebido no nı́vel
ρ(n) = n ' n, portanto aparece pela primeira vez no nı́vel seguinte n + 1. Já
ω aparece no nı́vel ω + 1, pois ele é criado no nı́vel ω (“infinito”), enquanto que
Vω consiste de todos os conjuntos que apareceram em nı́veis finitos. Em geral,
se α é um ordinal, então α é concebido no nı́vel α, logo aparece no nı́vel α + 1,
isto é: α ∈ Vα+1 − Vα . Cada nı́vel (diferente do nı́vel 0) contém exatamente
um ordinal, e cada ordinal denota um nı́vel. Neste sentido forte, os ordinais
descrevem os nı́veis da hierarquia cumulativa de tipos.
61
14 Aritmética Ordinal
Continuaremos estudando nesta seção os ordinais. Primeiro de tudo provaremos
que os ordinais são exatamente os conjuntos bem ordenados, dai a denominação
de ordinais. Lembremos da Definição 6.10 que bo(r, x) denota que r é uma boa
ordem em x, e min(v, r, u) denota v ∈ u ∧ (∀w)(w ∈ u → ¬(w r v)) (v é um
elemento r-minimal de u). Introduzimos a seguinte notação:
Definição 14.1 bf (r, x) denota (∀u)(u ⊆ x ∧ u 6= ∅ → (∃v)min(v, r, u)
(“r é bem fundada sobre x”)
Usando esta definição, é imediato que bo(r, x) ↔ bf (r, x) ∧ con(r, x), em que
con(r, x) denota que r é conectada em x (lembre da Definição 6.1). Como foi
provado nas Proposições 6.12 e 6.13, uma boa ordem r em x equivale a uma
ordem estrita r em x tal que todo subconjunto de x não vazio tem r-primeiro
elemento.
Lema 14.2 Seja E(x) = {hy, zi : y, z ∈ x ∧ y ∈ z}. Em S vale o seguinte:
(i) Se x é um ordinal, então E(x) é uma boa ordem em x.
(ii) Se r é bem fundada em z, então φ(x, y) ≡def (x, y ∈ z) ∧ (x r y) é bem
fundada (lembre da Definição 13.3).
Demonstração: (i) Se x é um ordinal, então y E(x) z sse y < z para todo
y, z ∈ x. Dado que y < z é uma relação bem fundada, então E(x) é bem
fundada em x. Se y, z ∈ x então y e x são ordinais. Pela lei de tricotomia para
ordinais temos que E(x) é conectada em x.
(ii) Seja r bem fundada em z, e considere φ(x, y) ≡def (x, y ∈ z) ∧ (x r y). Se
x 6= ∅, queremos provar o seguinte:
(∗) (∃ v ∈ x)(∀ w ∈ x)(w ∈ z ∧ v ∈ z → ¬(w r v),
pois ¬φ(w, v) ↔ [w ∈ z ∧ v ∈ z → ¬(w r v)]. Considere u = x ∩ z ⊆ z. Se u = ∅,

então tomando v ∈ x arbitrário (estamos assumindo que x é não vazio) obtemos
(∗) trivialmente, pois v 6∈ z. Se u 6= ∅ então, dado que u ⊆ z, temos que existe
v ∈ u (portanto v ∈ x) tal que ¬(w r v) para todo w ∈ u, pois r é bem fundada
em z. Seja w ∈ x; se w ∈ z e v ∈ z, isto é, se w ∈ z, então inferimos w ∈ u,
donde ¬(w r v). Isto prova (∗), e logo φ(x, y) satisfaz a primeira metade da
definição de relação bem fundada. Para a segunda metade, seja x arbitrário;
queremos provar que existe u tal que
(∗∗) x ⊆ u ∧ (∀ w, y)(y ∈ u ∧ φ(w, y) → w ∈ u).
Se x = ∅, então u = ∅ satisfaz trivialmente (∗∗). Se x 6= ∅ considere
u = x ∪ {w : w ∈ z ∧ (∃ y ∈ z)(w r y)}.
Temos que u 6= ∅ e x ⊆ u. Sejam w e y tais que y ∈ u e φ(w, y), logo: y, w ∈ z

e w r y. Daqui w ∈ u, pela definição de u, portanto vale (∗∗) e então φ(x, y) é
bem fundada.
62
Lema 14.3 Em ZF provamos o seguinte: se bf (r, z), então existe
h(x) = {h(y) : y ∈ z ∧ y r x}
para todo x ∈ z.
Demonstração: Usaremos recursão transfinita para definir os conjuntos h(x).

Considere a fórmula
G(X, x1 , y) ≡def (x1 = x1 ) ∧ (y = im(X)).
Seja F (x, y) a operação definida a partir de G(X, x1 , y) por recursão transfinita

na relação bem fundada φ(x, y) ≡def (x, y ∈ z) ∧ (x r y) (temos que φ(x, y) é
bem fundada pelo Lema 14.2(ii)). Por definição
AN T (F, x, φ(u, v)) = {hy, F 0 hyii : φ(y, x)}
portanto, fixado x ∈ z,
F 0 hxi = G0 hAN T (F, x, φ(u, v)), xi

= im(AN T (F, x, φ(u, v))
= {F 0 hyi : φ(y, x)}
= {F 0 hyi : x, y ∈ z ∧ y r x}
= {F 0 hyi : y ∈ z ∧ y r x}.
Desta maneira, F (x, y) representa a operação h(x) desejada para todo x ∈ z.
Teorema 14.4 (Caracterização dos Ordinais) Em ZF prova-se: se r é uma

boa ordem em z, então existe um ordinal α tal que
h : z−→ α, h(x) = {h(y) : y ∈ z ∧ y r x}
é um isomorfismo de conjuntos bem ordenados, isto é: h é uma bijeção tal que:
x r y sse h(x) < h(y). O ordinal α e o isomorfismo h são únicos.
Demonstração: Seja r uma boa ordem em z; logo, bf (r, z) donde existe h(x)
para todo x ∈ z, pelo Lema 14.3. Seja
r∗ = (r|z) ∪ {hy, zi : y ∈ z}
lembrando que r|z = {hx, yi : x ∈ z ∧ x r y}. Provaremos que r∗ é bem

fundada em z + 1. Seja então u ⊆ z + 1, u 6= ∅.
Caso 1: u ⊆ z. Como bf (r, z), existe v ∈ u tal que ¬(w r v) para todo w ∈ u.
Pela construção de r∗ , temos que ¬(w r∗ v) para todo w ∈ u pois r coincide
com r∗ em z × z.
Caso 2: u = {z} ∪ u1 tal que u1 ⊆ z. Se u1 = ∅ então v = z satisfaz: v ∈ u
e ¬(w r∗ v) para todo w ∈ u. Se u1 6= ∅ então u1 ⊆ z é não vazio, logo existe
v ∈ u1 tal que ¬(w r v) para todo w ∈ u1 . Como ¬(z r∗ v), pela construção de
63
r∗ , então ¬(w r∗ v) para todo w ∈ u.
Isto prova que bf (r∗ , z + 1). Pelo Lema 14.3 inferimos que existe
h∗ (x) = {h∗ (y) : (y ∈ z + 1) ∧ (y r∗ x)}
para todo x ∈ z + 1.
Fato 1: h∗ (x) = h(x) para todo x ∈ z.
Com efeito: seja ψ(x) ≡def (x ∈ z → h∗ (x) = h(x)). Fixemos y tal que
(HI) (∀w)(φ(w, y) → ψ(w)),
onde φ(u, v) ≡def (u, v ∈ z)∧(u r v) é uma relação bem fundada, pelo Lema 14.2(ii).
Suponhamos que y ∈ z; logo, pela construção de r∗ :
h∗ (y) = {h∗ (w) : (w ∈ z + 1) ∧ (w r∗ y)}

= {h∗ (w) : w ∈ z ∧ w r y}
= {h∗ (w) : φ(w, y)}.
Por (HI) temos que ψ(w) para todo w tal que φ(w, y). Como φ(w, y) implica w ∈
z, então obtemos que h∗ (w) = h(w) para todo w tal que φ(w, y). Daqui h∗ (y) =
h(y). Por indução transfinita sobre φ(x, y) inferimos que ψ(x) é verdadeira para
todo x como queriamos, provando o Fato 1.
A partir do Fato 1 e da definição de r∗ obtemos
h∗ (z) = {h∗ (y) : (y ∈ z + 1) ∧ (y r∗ z)} = {h∗ (y) : y ∈ z} = {h(y) : y ∈ z}.
Seja α ≡def h∗ (z). Provaremos que α é um ordinal. Seja x ∈ h(y), y ∈ z. Logo

x = h(w) tal que w ∈ z, pelas definições de h(y) e φ(w, y), portanto x ∈ α;
daqui α é transitivo. Sejam h(x), h(y) ∈ α. Como x, y ∈ z, então y = x ou
y r x ou x r y. Se x = y então h(x) = h(y). O caso em que y r x implica
h(y) ∈ h(x). Se x r y então h(x) ∈ h(y). Vemos assim que α é conectado. Daqui
obtemos que α é um ordinal, portanto h(x) é um ordinal para todo x ∈ z, e α
é bem ordenado pela relação E(α) = <, pelo Lema 14.2(i). A propriedade x r
y sse h(x) < h(y) é imediata, logo h : z−→ α é um isomorfismo de conjuntos
bem ordenados. Para provar a unicidade de α, suponha que hz, ri é isomorfo
a hβ, <i via g : z−→ β para um outro ordinal β. Logo g ◦ h−1 : α−→ β é um
isomorfismo.
Fato 2: Sejam α e β ordinais, e f : α−→ β un isomorfismo, isto é: f é uma
bijeção tal que γ < δ sse f (γ) < f (δ) para todo γ, δ ∈ α. Logo f (γ) = {f (δ) :
δ < γ}, donde f (γ) = γ para todo γ ∈ α.
Com efeito, se δ < γ < α, então f (δ) ∈ f (γ). Por outro lado, seja θ ∈ f (γ);
então θ = f (δ) para δ ∈ α, pois f é sobrejetora. Daqui f (δ) < f (γ) implica δ <
γ, e então θ = f (δ) com δ < γ, isto é: f (γ) = {f (δ) : δ < γ}. Considerando a
fórmula
ψ(x) ≡def x ∈ α → f (x) = x
então é agora muito simples provar por indução sobre ∈ que ψ(x) vale para
todo x (exercı́cio!), concluindo a prova do Fato 2.
64
Temos que g ◦ h−1 : α−→ β é um isomorfismo. Pelo Fato 2, g ◦ h−1 (x) = x
para todo x ∈ α. Mas g ◦ h−1 é sobrejetora, portanto α = β, e g ◦ h−1 = I(α).
Daqui g = h (compondo à direita com h). Isto mostra que α e h são unicos
para cada hz, ri.
Pelo Lema 14.2(i) vemos que todo ordinal α é bem ordenado pela relação <.
Reciprocamente, pelo Teorema 14.4, se z é um conjunto bem ordenado por uma
relação r então existe um único ordinal α e um único isomorphismo h : z−→ α
de conjuntos bem ordenados tal que hz, ri ' hα, <i. O ordinal α associado com
hz, ri é dito o tipo ordinal de hz, ri. Observe que o tipo ordinal α de z depende
da relação r: com efeito, z pode possuir duas estruturas de boa ordem r1 e r2
não isomorfas, de maneira a ter associados dois tipos ordinais, α1 para hz, r1 i e
α2 para hz, r2 i com α1 6= α2 .
Exemplo 14.5 Considere em N a estrutura usual r1 de boa ordem: n r1 m

sse n < m. Logo, h1 : N−→ ω dada por h1 (n) = n é o único isomorfismo de
hN, r1 i em hω, <i tal que ω é o tipo ordinal de hN, r1 i. Por outro lado, considere
a seguinte relação r2 em N:
n r2 m se n, m > 0 e n < m;
n r2 0 para todo n > 0.
Isto é: r2 coincide com a boa ordem usual < para todos os números naturais
positivos, e 0 é colocado como r2 -último elemento de N. É muito simples ver
que r2 é uma boa ordem em N (conferir!). Considere h2 : N−→ ω + 1 dada por

n − 1 se n > 0
h2 (n) = .
ω se n = 0
Temos que h2 é um isomorfismo entre hN, r2 i e hω + 1, <i (conferir!), portanto
ω + 1 é o tipo ordinal de hN, r2 i, sendo que ω 6= ω + 1. Isto mostra que o tipo
ordinal de um conjunto bem ordenado depende da boa ordem especificada.
Definição 14.6 Sejam α e β ordinais. Definimos a soma ordinal α + β como

sendo

 α


se β = 0


α+β = (α + γ) + 1 se β = γ + 1 .


 S

γ<β (α + γ) se β é limite ordinal

Para provar que a soma está bem definida, precisamos introduzir uma relação
bem fundada apropriada.
Lema 14.7 Considere a fórmula
φ(u, v) ≡def (ord(u) ∧ ord(v)) ∧ [(∃z)(v = z + 1 ∧ u = z) ∨ (lim(v) ∧ u ∈ v)].
65
Então φ(u, v) é uma relação bem fundada.
Demonstração: Seja x 6= ∅. Pelo axioma da regularidade, existe v ∈ x tal

que (∀ z ∈ x)(z 6∈ v). Logo, v 6= z + 1 para todo z ∈ x, e então não vale
(∃z)(v = z + 1 ∧ u = z) para todo u ∈ x. Se v é um ordinal limite então, dado
que z 6∈ v para todo z ∈ x, inferimos que não vale (lim(v) ∧ u ∈ v) para todo
u ∈ x. Desta maneira obtemos: u ∈ x → ¬φ(u, v), donde
x 6= ∅ → (∃ v ∈ x)(∀ w ∈ x)¬φ(w, v).
Para provar a segunda parte da Definição 13.3 de relação bem fundada, seja
x arbitrário, e considere u = F T (x), o fecho transitivo de x. Seja y ∈ u e w
tal que φ(w, y). Se z é um conjunto transitivo tal que x ∈ z então y ∈ z, pois
y ∈ F T (x). Dado que φ(w, y), então w ∈ y (é uma conseqüência direta da
definição de φ), logo w ∈ z (pois z é transitivo). Daqui w ∈ F T (x) = u, donde
(∃u)(x ⊆ u ∧ (∀ w, y)(y ∈ u ∧ φ(w, y) → w ∈ u)).
Isto prova que φ(u, v) é uma relação bem fundada.
LemaS14.8 Seja b um conjunto de ordinais, isto é: (∀x)(x ∈ b → ord(x)).

Logo b é um ordinal.
S
Demonstração: Seja a = b. Considere x ∈ a e y ∈ x. Logo, existe z ∈ b
tal que x ∈ z. Por hipótese z é um ordinal, e y ∈ x, x ∈ z; portanto y ∈ z
com z ∈ b, donde y ∈ a. Isto mostra que a é transitivo. Por outro lado, sejam
x, y ∈ a; logo existem z, w ∈ b tais que x ∈ z e y ∈ w. Por hipótese z e w são
ordinais, logo x e y são ordinais. Portanto x = y ou x ∈ y ou y ∈ x pela lei
de tricotomia para ordinais. Isto prova que a é conectado para ∈, portanto a é
um ordinal.
Proposição 14.9 A soma ordinal está bem definida em ZF, isto é, para cada
ordinal α e β, existe um único conjunto α + β definido de acordo com a Defi-
nição 14.6.
Demonstração: Para provar que a soma ordinal está bem definida usaremos
recursão transfinita sobre a relação bem fundada φ(u, v) do Lema 14.7. Con-
sidere a seguinte fórmula:
S
G(X, x1 , x2 , y) ≡def [x1 = 0∧y = x2 ]∨ S
[(∃z)(x1 = z+1)∧y = ( im(X))+1]
∨ [lim(x1 ) ∧ y = im(X)].
Logo, definimos por recursão transfinita sobre φ(u, v) uma operação F (x1 , x2 , y).
Temos que, se x1 é um ordinal, então
AN T (F, 0, x2 , φ(u, v)) = {hhw, x2 i, F 0 hw, x2 ii : φ(w, 0)} = ∅,
AN T (F, z + 1, x2 , φ(u, v)) = {hhw, x2 i, F 0 hw, x2 ii : φ(w, z + 1)}
66
= {hhz, x2 i, F 0 hz, x2 ii},
AN T (F, x1 , x2 , φ(u, v)) = {hhw, x2 i, F 0 hw, x2 ii : φ(w, x1 )}

= {hhw, x2 i, F 0 hw, x2 ii : w ∈ x1 }
segundo o caso: x1 = 0, x1 = z + 1 ou x1 é um ordinal limite, respectivamente.

Obtemos assim em cada caso:
im(AN T (F, 0, x2 , φ(u, v))) = ∅,
im(AN T (F, z + 1, x2 , φ(u, v))) = {F 0 hz, x2 i},
im(AN T (F, x1 , x2 , φ(u, v))) = {F 0 hw, x2 i : w ∈ x1 },
respectivamente. Portanto, se α e β são ordinais, então
F 0 h0, αi = G0 hAN T (F, 0, α, φ(u, v)), 0, αi = α,
F 0 hγ + 1, αi = G0 hAN T (F, γ + 1, α, φ(u, v)), γ + 1, αi = ( {F 0 hγ, αi}) + 1

S
= (F 0 hγ, αi) + 1,
F 0 hβ, αi = G0 hAN T (F, β, α, φ(u, v)), β, αi = {F 0 hγ, αi : γ ∈ β}

S
segundo o caso: β = 0, β = γ + 1 ou β é um ordinal limite, respectivamente.

Desta maneira F 0 hβ, αi = α + β é definido de acordo com 14.6; isto é, sempre
podemos definir o conjunto α + β.
Proposição 14.10 Sejam α e β ordinais. Então α + β é um ordinal.
Demonstração: Considere a fórmula
ψ(x) ≡def ord(x) → (∀z)(ord(z) → ord(z + x)).
Provaremos por indução sobre φ(u, v) (Lema 14.7) que ψ(x) vale para todo x;
logo teremos que α + β é um ordinal para todo ordinal α e β. Seja y um con-
junto satisfazendo
(HI) (∀w)(φ(w, y) → ψ(w)).
Queremos provar que vale ψ(y). Suponhamos então que y é um ordinal, e seja
z um ordinal. Provaremos que z + y é um ordinal. Temos três casos:
(a) y = 0. Logo z + y = z, portanto z + y é um ordinal.
(b) y = w + 1. Logo temos que φ(w, y), portanto vale ψ(w), por (HI). Como y
é um ordinal e w ∈ y, então w é um ordinal, logo ord(z) → ord(z + w). Mas z é
um ordinal, portanto z +w é um ordinal. Daqui inferimos que z +y = (z +w)+1
é um ordinal.
67
(c) y é um ordinal limite. Se w ∈ y então vale φ(w, y), donde vale ψ(w) por
(HI). Dado que w ∈ y implica que w é um ordinal, então, como antes, obtemos
que z + w é um ordinal para todo w ∈ y. Pelo Lema 14.8 deduzimos que
[
z + y = {z + w : w ∈ y}
é um ordinal.
Portanto, em todos os casos possı́veis temos que z + y é um ordinal, provando
que (HI) implica ord(y) → (∀z)(ord(z) → ord(z + y)), isto é, ψ(y). Por indução
transfinita inferimos que ψ(x) vale para todo x.
Proposição 14.11 Sejam α, β e γ ordinais. Então β < γ implica que α + β <

α + γ.
ψ(x) ≡def ord(x) → (∀y)(y < x → (∀z)(ord(z) → (z + y < z + x))).
Por indução sobre a fórmula φ(u, v) do Lema 14.7 provaremos que ψ(x) vale
para todo x. Suponha que temos
(HI) (∀w)(φ(w, x) → ψ(w)).
Queremos provar ψ(x). Suponha que x é um ordinal.

(1) Se x = 0 então y < x é falso para todo y, portanto
(∀y)(y < x → (∀z)(ord(z) → (z + y < z + x)))
é trivialmente verdadeiro.
(2) Se x = w + 1, considere y < x e z um ordinal.
(2.1) Se y = w então z + w < (z + w) + 1 = z + (w + 1) = z + x.
(2.2) Se y ∈ w então, dado que φ(w, x), obtemos ψ(w) por (HI), portanto
z + y < z + w (pois y < w). Mas z + w < z + x (caso 2.1), logo z + y < z + x.
(3) Se x é um ordinal limite, seja y < x e z um ordinal.S Como (z +y) ∈ (z +(y +
1)) (caso 2.1) e y+1 ∈ x, pois x é limite, então z+y ∈ {z+w : w ∈ x} = z+x.
Em todos os casos temos que (∀y)(y < x → (∀z)(ord(z) → (z + y < z + x))) é
verdadeiro. Portanto (HI) implica ψ(x) donde ψ(x) vale para todo x.
Proposição 14.12 α + (β + γ) = (α + β) + γ para todo ordinal α, β e γ.
ψ(z) ≡def ord(z) → (∀ x, y)(ord(x) ∧ ord(y) → ((x + y) + z = x + (y + z))).
Por indução na relação φ(u, v) do Lema 14.7 provaremos que ψ(x) vale para
todo x. Seja z tal que
(HI) (∀w)(φ(w, z) → ψ(w)).
68
Suponha que z é ordinal, e sejam x, y ordinais.
(1) Se z = 0, então (x + y) + z = x + y = x + (y + 0) = x + (y + z).
(2) Se z = w + 1, então temos φ(w, z), donde vale ψ(w) por (HI). Daqui
(x + y) + z = (x + y) + (w + 1) = ((x + y) + w) + 1
=HI (x + (y + w)) + 1 = x + ((y + w) + 1)
= x + (y + (w + 1)) = x + (y + z).
(3) Se z é limite, então provaremos primeiro os seguintes

Fatos: Seja γ ordinal limite.
(a) Se x ∈ α + θ tal que θ ∈ β + γ então existe δ < γ tal que x ∈ α + (β + δ).
(b) β + γ é um ordinal limite.
Com efeito, seja x ∈ α + θ tal que θ ∈ β + γ. Logo θ ∈ β + δ tal que δ ∈ γ.
De θ < β + δ inferimos que α + θ < α + (β + δ), pela Proposição 14.11. Logo
x ∈ α + (β + δ)Spara algum δ ∈ γ, provando o item (a). Para provar (b), observe
que β + γ = {β + δ : δ ∈ γ} é não vazio. Seja u ∈ β + γ, logo u ∈ β + δ
para algum δ ∈ γ. Daqui u + 1 ∈ (β + δ) + 1 = β + (δ + 1), onde δ + 1 ∈ γ.
Assim u + 1 ∈ β + γ, donde β + γ é um ordinal limite, por [LIM]. Isto conclui
a demonstração dos Fatos.
Por causa dos Fatos(b) obtemos que y +z é um ordinal limite, e pelos Fatos(a)
[ [
x + (y + z) = {x + w : w ∈ y + z} ⊆ {x + (y + w) : w ∈ z}.
Além disso, se w ∈ z então (y + w) ∈ (y + z) pela Proposição 14.11, logo:
u ∈ x + (y + w) para w ∈ z implica u ∈ x + w0 com w0 ∈ y + z

S
implica u ∈ {x + w : w ∈ y + z},
donde [ [
{x + (y + w) : w ∈ z} ⊆ {x + w : w ∈ y + z}
e assim
[ [
x + (y + z) = {x + w : w ∈ y + z} = {x + (y + w) : w ∈ z}.
Mas, para todo w ∈ z temos que φ(w, z) é satisfeita, logo vale ψ(w) por (HI),
donde x + (y + w) = (x + y) + w para todo w ∈ z. Portanto
[ [
x + (y + z) = {x + (y + w) : w ∈ z} = {(x + y) + w : w ∈ z} = (x + y) + z.
Acabamos de provar que (HI) implica ψ(z). Por indução transfinita obtemos
que ψ(z) vale para todo z.
S
Lema 14.13 Seja α um ordinal limite. Então α = α.
Demonstração:
S Seja x ∈ α; logo, x+1 ∈ S
α. Portanto x ∈ x+1 com x+1 S ∈ α,
donde x ∈ α. Daqui obtemos que α ⊆ α. Reciprocamente, seja x ∈ α;
S x ∈ y para algum y ∈ α; dado que αSé transitivo, então x ∈ α. Portanto
logo
α ⊆ α. Desta maneira, temos que α = α.
69
Proposição 14.14 Seja α um ordinal. Vale o seguinte:
(i) 0 + α = α.
(ii) α + 1 = α + 1.
Demonstração: (i) Por indução na relação φ(u, v) do Lema 14.7, provaremos

que (∀x)ψ(x), onde
ψ(x) ≡def ord(x) → (0 + x = x).
Seja x um conjunto satisfazendo
(HI) (∀z)(φ(z, x) → ψ(z)).
Assuma que x é um ordinal. Temos três casos para analizar:

(a) x = 0. Logo 0 + x = 0 + 0 = 0 = x.
(b) x = z + 1. Logo φ(z, x) e ord(z), portanto 0 + z = z, por (HI). Daqui
0 + x = 0 + (z + 1) = (0 + z) + 1 = z + 1 = x.
(c) x é um ordinal limite. Se z ∈ x, então φ(z, x) e ord(z), portanto 0 + z = z,
por (HI). Daqui
[ [ [
0 + x = {0 + z : z ∈ x} = {z : z ∈ x} = x=x
pelo Lema 14.13. Vemos que nos três casos possı́veis 0 + x = x. Portanto (HI)
implica ψ(x) donde, por indução transfinita, obtemos que ψ(x) é verdadeira
para todo x.
(ii) Temos que 1 = 0 + 1, pela definição de 1. Logo
α + 1 = α + (0 + 1) = (α + 0) + 1 = α + 1.

Definiremos agora o produto de ordinais.

Definição 14.15 Sejam α e β ordinais. Definimos o produto ordinal α·β como
sendo
α · 0 = 0;
α · (β +S1) = (α · β) + α;
α · β = γ<β α · γ se β é ordinal limite.
Como foi feito com a soma ordinal, podemos provar que α · β pode ser definido,
e α · β é um ordinal. A relação funcional G(X, x1 , x2 , y) utilizada para definir
F (x1 , x2 , y) tal que F 0 hβ, αi = α · β é dada neste caso por
S
G(X, x1 , x2 , y) ≡def [x1 = 0∧y = 0]∨[(∃z)(x
S 1 = z+1)∧y = ( im(X))+x2 ]
∨ [lim(x1 ) ∧ y = im(X)]
(confira os detalhes!).
70
Proposição 14.16 Seja α um ordinal. Logo 0 · α = 0.
Demonstração: Por indução na relação φ(u, v) do Lema 14.7, provaremos que
(∀x)ψ(x), onde
ψ(x) ≡def ord(x) → (0 · x = 0).
(HI) (∀z)(φ(z, x) → ψ(z)).

(a) x = 0. Logo 0 · x = 0 · 0 = 0.
(b) x = z + 1. Logo φ(z, x) e ord(z), portanto 0 · z = 0, por (HI). Daqui
0 · x = 0 · (z + 1) = (0 · z) + 0 = 0 + 0 = 0.
(c) x é um ordinal limite. Se z ∈ x, então φ(z, x) e ord(z), portanto 0 · z = 0,
por (HI). Daqui
[ [ [
0 · x = {0 · z : z ∈ x} = {0 : z ∈ x} = {0} = 0.
Vemos que nos três casos possı́veis 0 · x = 0. Portanto (HI) implica ψ(x) donde,
por indução transfinita, obtemos que ψ(x) é verdadeira para todo x.
Proposição 14.17 Seja α um ordinal. Então α · 1 = α = 1 · α.
Demonstração: Por indução na relação φ(u, v) do Lema 14.7, provaremos que

(∀x)ψ(x), onde
ψ(x) ≡def ord(x) → (1 · x = x).
(HI) (∀z)(φ(z, x) → ψ(z)).

(a) x = 0. Logo 1 · x = 1 · 0 = 0 = x.
(b) x = z + 1. Logo φ(z, x) e ord(z), portanto 1 · z = z, por (HI). Daqui
1 · x = 1 · (z + 1) = (1 · z) + 1 = z + 1 = z + 1 = x.
(c) x é um ordinal limite. Se z ∈ x, então φ(z, x) e ord(z), portanto 1 · z = z,
por (HI). Daqui
[ [ [
1 · x = {1 · z : z ∈ x} = {z : z ∈ x} = z=z
pelo Lema 14.13. Daqui 1 · x = x em todos os casos. Assim (HI) implica

ψ(x) donde, por indução transfinita, inferimos que (∀x)ψ(x). A segunda parte
é provada diretamente:
x · 1 = x · (0 + 1) = (x · 0) + x = 0 + x = x
pelo Lema 14.14(i).
71
Proposição 14.18 Se α > 0 e β é ordinal limite, então α · β é um ordinal
limite.
Demonstração: Por definição temos que

[
α · β = {α · γ : γ ∈ β},
portanto α · β 6= 0. Seja x ∈ α · β; logo x ∈ α · γ para algum γ ∈ β, donde

x + 1 ∈ (α · γ) + 1. Dado que α < 1 sse α = 0 então, pela lei de tricotomia dos
ordinais, temos dois casos para serem analizados:
(a) α = 1. Logo
(α · γ) + 1 = (α · γ) + 1 = (α · γ) + α = α · (γ + 1).
Mas γ + 1 ∈ β, pois γ ∈ β e β é ordinal limite. Daqui x + 1 ∈ α · β.

(b) 1 < α. Pelo Lema 14.14(ii) e a Proposição 14.11 inferimos:
(α · γ) + 1 = (α · γ) + 1 < (α · γ) + α = α · (γ + 1).
Daqui x + 1 ∈ α · (γ + 1) onde γ + 1 ∈ β, pois γ ∈ β e β é um ordinal limite.

Portanto x + 1 ∈ α · β. Nos dois casos possı́veis para α obtemos: x ∈ α · β
implica x + 1 ∈ α · β. Isto prova que α · β é um ordinal limite, pela propriedade
[LIM] (introduzida logo após a Definição 12.7).
Por indução transfinita pode ser provado o seguinte:

Proposição 14.19 Sejam α, β e γ ordinais. Em ZF vale o seguinte:
(a) α · (β + γ) = (α · β) + (α · γ).
(b) α · (β · γ) = (α · β) · γ.
Definiremos agora a exponenciação ordinal.
Definição 14.20 Sejam α e β ordinais. A exponenciação ordinal αβ é definida
da maneira seguinte:
α0 = 1;
αβ+1 = αβ · α;
αβ = γ∈β αγ se β é ordinal limite e 0 < α;
S
αβ = 0 se β é ordinal limite e α = 0.
Podemos provar como antes que a definição acima é legitimada em ZF por re-
cursão transfinita em φ(u, v) (Lema 14.7) utilizando
S
G(X, x1 , x2 , y) ≡def [x1 = 0∧y = 1]∨[(∃z)(x1 =Sz +1)∧y = ( im(X))·x2 ]
∨ [lim(x1 ) ∧ x2 6= 0 ∧ y = im(X)]
∨ [lim(x1 ) ∧ x2 = 0 ∧ y = 0]
para definir uma operação F (x1 , x2 , y) tal que F 0 hβ, αi = αβ (confira os deta-
lhes!). Por indução transfinita pode ser provado o seguinte:
72
Proposição 14.21 Sejam α, β e γ ordinais. Em ZF valem as seguintes pro-
priedades:
(a) αβ é um ordinal.
(b) α1 = α.
(c) Se β > 0 então 0β = 0.
(d) 1α = 1.
(e) αβ+γ = αβ · αγ .
(f ) (αβ )γ = αβ·γ .
Observação 14.22 Se bem as operações de soma, produto e exponenciação

ordinal possuem propriedades análogas às propriedades das mesmas operações
numéricas, existem algumas diferências notórias. Certas asimetrias (não comu-
tatividade da soma e o produto, por exemplo) aparecem por causa das próprias
definições, feitas por recursão transfinita numa só das variáveis. Podemos
destacar os seguintes exemplos em que as operações são “mal comportadas”:
1 + ω = ω 6= ω + 1; logo a soma ordinal não é comutativa.
2 · ω = ω 6= ω · 2, logo o produto ordinal não é comutativo.
(1 + 1) · ω = 2 · ω = ω 6= (1 · ω) + (1 · ω);
logo o produto ordinal não é distributivo à direita da soma ordinal.
15 Cardinais
Finalmente estudaremos a noção de número cardinal. Os cardinais foram in-
troduzidos originalmente por Frege e Russell para indicar o “tamanho” dos
conjuntos. A idéia intuitiva é que dois conjuntos a e b “têm o mesmo tamanho”
(ou seja, o cardinal de a é igual ao cardinal de b) se existe uma bijeção entre
eles, isto é, se são equipolentes. Portanto a definição natural de cardinal de um
=
conjunto a, denotado por a, é a coleção de todos os conjuntos b equipolentes
com a. Isto é, a partir da relação de equivalência ≈ (equipolência), definimos
=
a = {b : a ≈ b}.
Portanto o cardinal de um conjunto a, na concepção de Frege e Russell, é a classe

de equivalência de a na relação ≈. O problema que apresenta esta definição é
=
que a é uma classe própria, isto é, o cardinal de a não pode ser legitimado em
= S=
ZF (nem em ZFC); se a fosse legitimado, podemos provar que a é o conjunto
de todos os conjuntos, uma contradição. A solução para este problema é definir
o cardinal de um conjunto a partir da teoria de ordinais. A definição é feita
de maneira a escolher um conjunto (ordinal) equipolente a x; de fato, o ordinal
escolhido será o menor ordinal equipolente com x. Como já parece evidente, a
teoria de cardinais faz um uso pesado do Axioma da Escolha [AE]. A partir de
[AE] poderemos provar a Lei de Tricotomia que estabelece que a relação é
total entre conjuntos (isto é, dados x e y, então x y ou y x), assim como
73
demonstrar que todo conjunto é similar a um ordinal (o teorema da boa ordem:
todo conjunto x admite uma boa ordem). Na primeira parte desta exposição
não utilizaremos [AE], mas ele deverá ser considerado posteriormente, fato que
será oportunamente informado. Começamos reformulando a noção de conjunto
finito, agora utilizando a representação dos números naturais em ZF.
Definição 15.1 F IN (x) denota (∃n)(n ∈ ω ∧ x ≈ n)

(“x é n-finito”);
IN F IN (x) denota ¬F IN (x)
(“x é infinito”);
EN U M (x) denota x ≈ ω
(“x é enumerável”).
Antes de provar as seguintes propriedades precisamos do seguinte resultado.
Lema 15.2 Seja α um inteiro. Então α ≺ α + 1.
Demonstração: Seja α um inteiro, e f : α−→ α + 1 dada por f (x) = x; logo

f é injetora, portanto α α + 1, pela definição de . Provaremos por indução
matemática que (∀x)ψ(x), onde
ψ(x) ≡def int(x) → (x 6≈ x + 1).
É imediato que 0 6≈ 1 = 0+1, portanto vale ψ(0). Suponha que vale ψ(y); para
provar ψ(y+1), suponha que y+1 é um inteiro, logo y é um inteiro, pois y ∈ y+1,
portanto y 6≈ y + 1. Suponhamos que existe uma bijeção f : y + 1−→(y + 1) + 1;
daqui inferimos que f |y é uma bijeção entre y e ((y + 1) + 1) − {f (y)}.
Fato: Seja z um conjunto, e v ∈ z + 1. Portanto (z + 1) − {v} ≈ z.
Com efeito, se v = z então (z + 1) − {v} = z, e a equipolência é imediata. Por
outro lado, se v ∈ z então definimos g : ((z + 1) − {v})−→z como g(u) = u se
u 6= z, e g(z) = v. É claro que g é uma bijeção; isto conclui a prova do Fato.
Vemos então que, por um lado, f |y é uma bijeção estabelecendo que y ≈ ((y +
1) + 1) − {f (y)} enquanto que, por outro lado, ((y + 1) + 1) − {f (y)} ≈ y + 1,
em virtude do Fato; portanto y ≈ y + 1, uma contradição. Daqui obtemos que
y +1 6≈ (y +1)+1. Desta maneira ψ(y) implica int(y +1) → y +1 6≈ ((y +1)+1),
isto é, provamos que ψ(y) → ψ(y + 1). Por indução matemática obtemos que
(∀x)(int(x) → ψ(x)) ou, equivalentemente, (∀x)ψ(x), isto é, α 6≈ α + 1 para
todo inteiro α. Como α α + 1, então deduzimos que α ≺ α + 1 para todo
inteiro α.
Proposição 15.3 (i) Em S vale o seguinte: se x e y são inteiros, então x y

sse x ≤ y.
(ii) Em Z vale o seguinte: ω é infinito.
Demonstração: (i) Provaremos por indução matemática que para todo x vale
ψ(x), onde
ψ(x) ≡def int(x) → (∀y)(int(y) → (x y → x ≤ y)).
74
É imediato que ψ(0) é verdadeira (confira!). Seja x tal que ψ(x) é verdadeira.
Para provar ψ(x + 1), assuma que x + 1 é um inteiro; logo x é um inteiro, donde
(∗) (∀y)(int(y) → (x y → x ≤ y))
pois vale ψ(x). Suponha que y é um inteiro tal que x + 1 y. Como x ≺ x + 1

(pelo Lema 15.2), então x ≺ y; por (∗) inferimos que x < y (não poderiamos
ter x = y, senão x ≈ y, o que contradiz x ≺ y), portanto x + 1 ≤ y. Logo ψ(x)
implica ψ(x + 1). Por indução matemática obtemos que ψ(x) vale para todo x,
provando assim a primeira metade de (i). A outra implicação é imediata: x ≤ y
implica x y para todo ordinal x e y.
(ii) Suponhamos que ω é n-finito, isto é, existe um inteiro n tal que ω ≈ n.
Daqui inferimos que ω ≈ n e n ≺ n + 1, pelo Lema 15.2, logo ω ≺ n + 1. Mas
n + 1 = n + 1, logo n + 1 ω (pois n + 1 ⊆ ω). Portanto n + 1 ω, ω ≺ n + 1
implica n + 1 ≺ n + 1, uma contradição. Daqui obtemos que ω é infinito.
Definição 15.4 inic(α) denota ord(α) ∧ (∀β)(β < α → (α 6≈ β))

(“α é um ordinal inicial”).
Pela Proposição 15.3(i) vemos que todo ordinal n-finito n é um ordinal inicial:
se β ≈ n então β n e n β, donde β ≤ n e n ≤ β. Pela tricotomia dos
ordinais inferimos que β = n, e então β 6< n. Por 15.3(ii) e pela definição de ω
é imediato que ω é também um ordinal inicial. Por outro lado, é simples provar
que
ω ≈ ω + 1 ≈ ω + 2 ≈ ··· ≈ ω + ω = ω · 2 ≈ ω · 3 ≈ ···
junto com
ω
ω ≈ ω 2 ≈ ω 3 ≈ · · · ≈ ω ω ≈ ω ω ≈ · · · etc.
(confira!). Pode ser provado que nenhuma das operações sobre ordinais consegue
produzir um ordinal inicial superior a partir de ω. Para superar esta barreira
devemos considerar o conjunto das partes P(x); uma maneira possı́vel é através
da função aleph de Hartogs:
Definição 15.5 ℵ(x) denota {α : α x}

(“o aleph de x”).
Proposição 15.6 Em ZF provamos que ℵ(x) é legitimado, e ℵ(x) é um ordinal

inicial para todo conjunto x.
Demonstração: Dado um conjunto x, considere o seguinte conjunto:
z = {r : (∃y)(y ⊆ x ∧ r ⊆ y × y ∧ bo(r, y))}.
Dado que z ⊆ P(x × x), então z é legitimado por [A2]. Por outro lado, lem-
brando que F (r) denota o conjunto dom(r)∪im(r), considere a seguinte fórmula:
75
isom(r, α) ≡def (∃h)(bij(h, F (r), α) ∧ (∀x)(∀y)(x, y ∈ F (r)
→ (((x r y) ↔ h(x) < h(y)))).
O teorema de caracterização dos ordinais prova que se r é uma boa ordem sobre
a = F (r), então (∃!α)isom(r, α) (onde (∃!) indica existência e unicidade). Logo,
a fórmula
ψ(r, α) ≡def bo(r, F (r)) ∧ isom(r, α)
satisfaz a condição F U Nψ do axioma de substituição [A7], portanto existe o
conjunto
b = {α : (∃r)(r ∈ z ∧ ψ(r, α))} = {α : (∃r)(r ∈ z ∧ isom(F (r), α)}.
Pela definição de z e dado que (∃!α)isom(F (r), α) para todo r ∈ z, sendo que
F (r) ⊆ x, vemos que b = ℵ(x), portanto o conjunto ℵ(x) é legitimado para todo
conjunto x. Para provar que ℵ(x) é um ordinal basta provar que é transitivo,
pois ℵ(x) é um conjunto de ordinais. Considere então α ∈ ℵ(x) e β < α. Logo:
β ⊆ α e α x, donde β x. Daqui β ∈ ℵ(x) e ℵ(x) é transitivo, sendo
portanto um ordinal. Suponha que existe β < ℵ(x) tal que ℵ(x) ≈ β. Dado
que β ∈ ℵ(x), então obtemos que β x, donde ℵ(x) x. Daqui ℵ(x) ∈ ℵ(x),
uma contradição. Logo ℵ(x) é um ordinal inicial.
Observe que, se α é um ordinal, então α ∈ ℵ(α), pois α α. Portanto α < ℵ(α).

Isto significa que, para cada ordinal α, existe um ordinal inicial ℵ(α) maior do
que α. Pelo Teorema de Cantor-Schröder-Bernstein ℵ(α) deve ser o seguinte
ordinal inicial. Com efeito, suponha que β é um ordinal inicial diferente de
ℵ(α) tal que α < β. Pela lei de tricotomia para ordinais temos que β < ℵ(α) ou
ℵ(α) < β. Suponhamos que β < ℵ(α), logo β ∈ ℵ(α) e então β α. Por outro
lado, α < β implica α ⊆ β donde α β. Pelo Teorema de Cantor-Schröder-
Bernstein inferimos que β ≈ α, sendo que α < β e β é um ordinal inicial,
contradição. Portanto ℵ(α) < β, isto é: ℵ(α) é o mı́nimo ordinal inicial maior
que α.
Definição 15.7 Por recursão transfinita definimos a seguinte seqüência de or-

dinais iniciais infinitos:
ℵ0 = ω;
ℵα+1 =
S ℵ(ℵα );
ℵλ = β<λ ℵβ se λ é um ordinal limite.
Como foi feito anteriormente, podemos provar que a definição por recursão
transfinita 15.7 é legitimada em ZF, e que ℵα é um ordinal inicial infinito para
todo ordinal α (conferir!). Reciprocamente, por indução transfinita podemos
provar que se α é ordinal inicial infinito, então existe um ordinal β tal que
α = ℵβ . Logo: inic(α) ∧ IN F IN (α) ↔ (∃β)(α = ℵβ ) é um teorema em ZF.
Definição 15.8 Um cardinal é um ordinal inicial.
76
Portanto, todo cardinal infinito é da forma ℵα para algum ordinal α. Uma
notação alternativa para ℵα é ωα . Por indução transfinita podemos provar o
seguinte resultado, que utilizaremos para definir as operações aritméticas entre
cardinais:
Proposição 15.9 Em ZF vale o seguinte: Se α é um cardinal e ω ≤ α, então

α ≈ (α × α).
Se α é um ordinal, então para todo ordinal β: β ≈ α implica que β α,

portanto β ∈ ℵ(α). Desta maneira existe por [A2] o conjunto
aα = {β : β ∈ ℵ(α) ∧ β ≈ α} = {β : β ≈ α}.
Temos que α ≈ α, portanto aα 6= ∅. Daqui inferimos que existe o conjunto

= \ \
α= aα = {β : β ≈ α}.
= =
O conjunto α é dito o cardinal de α. Pode ser provado que α é um cardinal, e
=
que α = α se α é um cardinal. Se x é um conjunto e x ≈ α para algum ordinal
α então β ≈ x sse β ≈ α para todo ordinal β, portanto existe
= \ =
x ≡def {β : β ≈ x} = α.
Definição 15.10 Seja x um conjunto. O cardinal de x é definido como

 T
 {β : β ≈ x} se x ≈ α para algum ordinal α
=
x= .
∅ em caso contrário

Teorema 15.11 (Princı́pio da Boa Ordem) Em ZFC (isto é, em ZF mais o

axioma da escolha) provamos o seguinte: todo conjunto x admite uma boa ordem
r em x.
= T
Daqui temos que para todo conjunto x existe x = {β : β ≈ x}. Com
efeito, se x é um conjunto, então existe uma boa ordem r em x; pelo teorema
de caracterização dos ordinais existe um único ordinal α isomorfo a hx, ri; em
= T
particular x ≈ α. Pela Definição 15.10 obtemos que x = {β : β ≈ x}.
Devemos observar que, de fato, o axioma da escolha é equivalente ao princı́pio
da boa ordem. Por outro lado, o cardinal de um conjunto é determinado pelas
diferentes possibilidades que existem para definir uma boa ordem r em x; cada
r determina um ordinal α isomorfo a hx, ri, portanto o mı́nimo desses ordinais
corresponde à única boa ordem sobre x que o faz um cardinal.
Proposição 15.12 Seja b um conjunto e β um ordinal tal que b β. Con-

sidere a seguinte relação em b: x r y sse f (x) < f (y) onde f é uma função
injetora de b em β. Logo r é uma boa ordem em b tal que, se α é o tipo ordinal
de hb, ri, então α ≤ β.
77
Demonstração: É imediato que r é uma boa ordem em b, pois r é computada
a partir da cópia f “b de b em β na relação de boa ordem ∈. Seja h : b−→α o
isomorfismo entre b e o tipo ordinal α de b dado por
h(x) = {h(y) : y r x} = {h(y) : f (y) < f (x)}.
Logo, h(x) < h(y) sse x r y sse f (x) < f (y). Definimos uma função g : α−→ β
dada por g(γ) = f (x) onde x é o único elemento de b tal que γ = h(x). Logo g
é uma função satisfazendo
γ = h(x) < h(y) = δ sse g(γ) = f (x) < f (y) = g(δ)
portanto g é um isomorfismo entre α e g“α. Logo g(γ) = γ para todo γ ∈ α
(pelo Fato 2 na demonstração do Teorema 14.4) e então α ≤ β.
Corolário 15.13 Sejam b e c conjuntos. Em ZFC vale o seguinte: se b ⊆ c

= =
então b ≤ c.
= T
Demonstração: Seja x ∈ b = {β : β ≈ b}. Queremos provar que x ∈
= T
c = {β : β ≈ c}. Seja então β um ordinal equipolente com c, e considere
f : c−→ β uma bijeção. Logo f |b é uma bijeção entre b e f “b ⊆ β, donde b β.
Considere o ordinal α ≤ β da Proposição 15.12. Logo α ≈ b donde x ∈ α, pois
= = = =
x ∈ b. Mas α ⊆ β, portanto x ∈ β. Provamos assim que x ∈ c, e então b ⊆ c,
= =
donde b ≤ c.
Definição 15.14 Uma famı́lia de conjuntos indexada por um conjunto I é um

conjunto
(xi )i∈I = {hi, xi i : i ∈ I}
onde xi é um conjunto para cada i ∈ I. Mais formalmente, uma famı́lia (xi )i∈I
é uma função x : I−→a tal que I e a são conjuntos,
S com I 6= ∅. Se i ∈ I
então x(i) é denotado por xi . Por outro lado, i∈I xi denota o conjunto
[
{z ∈ a : (∃i)(i ∈ I ∧ z ∈ xi )}.
S S
Isto é, i∈I xi = im(x). O produto cartesiano de (xi )i∈I é dado por
Y [
xi = {f : f un(I, xi ) ∧ (∀i)(i ∈ I → f (i) ∈ xi )}.
i∈I i∈I
Definição 15.15 Seja L (κi )i∈I uma famı́lia indexada de cardinais.

(i) A soma cardinal i∈I κi é o cardinal κ construı́do da maneira seguinte: se
(ai )i∈I é uma famı́lia de conjuntos dois a dois disjuntos (isto é, ai ∩ aj = ∅ se
= S
i 6= j) tal que a i = κi para todo i ∈ I então κ é o cardinal do conjunto i∈I ai .
Se I = {0, 1} escreveremos J κ0 ⊕ κ 1 .
(ii) O produto cardinal i∈I κi é o cardinal κ construı́do da maneira seguinte:
=
se (ai )i∈I é uma famı́liaQde conjuntos tal que a i = κi para todo i ∈ I então κ é
o cardinal do conjunto i∈I ai . Se I = {0, 1} escreveremos κ0 κ1 .
(iii) Se κ, θ são cardinais, definimos a exponenciação cardinal κθ como sendo
= =
o cardinal µ dado pelo cardinal do conjunto xy , onde x = κ e y = θ.
78
Vemos que sem o axioma da escolha não podemos assegurar que existem estas
operações para I infinito, pois nada garante a existência dos conjuntos ai tais
=
que a i = κi para todo i ∈ I nem a existência da soma e o produto cardinal. O
axioma da escolha nos assegura que estas operações existem e são bem definidas,
isto é, independem dos conjuntos escolhidos para a sua realização. Observemos
que κθ é um caso particular de produto cardinal, em que I = θ e κi = κ
para todo i ∈ θ. Algumas propriedades das operações entre cardinais são as
seguintes (no caso em que a propriedade requer do axioma da escolha, isto é
indicado acrescentando “([AE])” no inı́cio do enunciado).
Proposição 15.16 As operações entre cardinais satisfazem as propriedades

seguintes:
(i) κ ⊕ λ = λ ⊕ κ, κ λ = λ κ.
(ii) κ ⊕ (λ ⊕ θ) = (κ ⊕ λ) ⊕ θ, κ (λ θ) = (κ λ) θ.
(iii) Se κ ≤ λ então κ ⊕ θ ≤ λ ⊕ θ e κ θ ≤ λ θ.
(iv) κ (λ ⊕ θ) =L (κ λ) ⊕ (κ
L θ).
(v) ([AE]) κ ( i∈I λi ) = i∈I (κ λi ).
L =
(vi) ([AE]) Se κi = κ para todo i ∈ I, então i∈I κi = I κ.
(vii) κ ⊕ λ é o cardinal do ordinal κ + λ, e κ λ é o cardinal do ordinal κ · λ.
Suponha que β é um cardinal. Estamos interessados em encontrar o mı́nimo

cardinal α tal que existe uma partição de β em α pedaços de cardinalidade es-
tritamente menor do que β. Esse cardinal mı́nimo α é a cofinalidade de β, e será
denotado cf (β). No caso em que β é um cardinal tal que cf (β) = β dizemos que
β é regular. Por exemplo, ω não pode ser particionado numa quantidade finita
de subconjuntos finitos; para cobrir todo ω por uma partição de subconjuntos
finitos precissamos de ω subconjuntos; portanto ω é um cardinal regular.
Definição 15.17 Sejam α e β ordinais. S

α cf β denota α ≤ β ∧ (∃f )(f un(f, α, β) ∧ β = im(f ))
(“α é cofinal em
T β”).
cf (β) denota {α : α cf β}
(“a cofinalidade de β”).
Dado que α cf β implica que α ≤ β (donde α ∈ β + 1) então Cβ = {α : α cf

β} ⊆ β + 1, portanto Cβ é legitimado por [A2]. Por outro lado β cf β, portanto
Cβ 6= ∅ Se então existe cf (β) para todo ordinal β. Se α cf β e f : α−→ β
tal que im(f ) = S β então, para cada γ ∈ β existe δ ∈ α tal que γ ∈ f (δ),
pela definição de . Ou seja, para cada γ ∈ β existe δ ∈ α tal que γ < f (δ).
Em outras palavras, a imagem de f não é limitada em β, portanto f é uma
seqüência
S em β (indexada por α) convergendo a β (a convergência é dada pela
união ). Observe que se β = α + 1 então cf (β) = 1. Com efeito, 1 cf (α + 1)
via f (0) = α.
Proposição 15.18 Sejam α e β ordinais limites. Em ZF vale o seguinte:

(i) α cf β é uma relação transitiva.
(ii) cf (β) é um cardinal.
79
Definição 15.19 Seja κ um cardinal. Dizemos que κ é regular se cf (κ) = κ.
Em caso contrário, isto é, se cf (κ) < κ, então κ é dito singular.
Proposição 15.20 Em ZFC vale o seguinte:

(i) ω é regular.
(ii) ℵα+1 é regular para todo α.
(iii) Se λ é um ordinal limite então cf (ℵλ ) = cf (λ).
Observe que, pela proposição anterior, cf (ℵω ) = cf (ω) = ω. Por exemplo, ℵω

pode ser atingido pela seqüência
ℵ0 < ℵ1 < ℵ2 < · · · −→ℵω
provando que ℵω é singular. Também temos que cf (ℵℵω ) = ω, considerando,

por exemplo, a seqüência
ℵℵ0 < ℵℵ1 < ℵℵ2 < · · · −→ℵℵω .
Finalmente, discutiremos brevemente a Hipótese do Contı́nuo (HC). Temos

duas maneiras para passar de um cardinal a outro superior: considerar ℵ(κ) > κ
ou, pelo teorema de Cantor, considerar 2κ > κ. A Hipótese do Contı́nuo afirma
o seguinte:
(HC) 2ℵ 0 = ℵ 1 .
Dado que R ≈ 2ℵ0 então (HC) afirma que todo subconjunto de R não enu-
merável é equipolente com R, isto é, não existem subconjuntos de R de cardi-
nalidade intermediária entre ℵ0 e a cardinalidade de R. Portanto (HC) afirma
que 2κ e ℵ(κ) coincidem no primeiro valor ℵ0 . A Hipótese Generalizada do
Contı́nuo (HGC) afirma que estas funções coincidem em todo cardinal κ. Em
outras palavras, para cada cardinal infinito κ não existe um cardinal estrita-
mente entre κ e 2κ . Em termos da função ℵ temos que (HGC) afirma que
(HGC) 2ℵα = ℵα+1
para todo ordinal α. Com a ajuda de (HGC) resolvemos todas as questões

acerca das potências cardinais:
ℵ
Teorema 15.21 Assumamos (HGC). Em ZFC temos que ℵαβ é determinado,
sendo que
ℵ
(i) ℵαβ = ℵβ+1 se α ≤ β;
ℵ
(ii) ℵαβ = ℵα se ℵβ < cf (ℵα );
ℵ
(iii) ℵαβ = ℵα+1 se cf (ℵα ) ≤ ℵβ ≤ ℵα .
Em 1936 Kurt Gödel demonstrou que, se a teoria ZF é consistente, então ZF C

com o acréscimo de (HC) é consistente. Por outro lado, Cohen demonstrou em
1964 (mediante a técnica de forcing) que, se a teoria ZF é consistente, então
ZF C com o acréscimo da negação de (HC) também é consistente, portanto a
80
Hipótese do Contı́nuo é indecidı́vel na teoria ZF C. Também foi provado por
Cohen que, se a teoria ZF é consistente, então ZF com o acréscimo da negação
de [AE] também é consistente. Vemos assim que, em particular, tanto ZF
com o acréscimo de [AE] quanto ZF com o acréscimo da negação de [AE] são
consistentes, desde que ZF seja consistente. Assim, ambas teorias de conjuntos
são válidas, e a inclusão do Axioma da Escolha ou da sua negação acaba sendo
uma questão de escolha.
Devemos observar, finalmente, que os famosos teoremas de incompletude de
Gödel se aplicam a ZF , portanto existem sentenças de ZF que são indecidı́veis
em ZF . Em particular, se ZF é consistente, então ZF não pode provar a sua
própria consistência.
References
[1] C.A. di Prisco, Una Introducción a la Teorı́a de Conjuntos, Coleção
CLE, vol. 20, (UNICAMP), 1997.
[2] F.R. Drake, Set Theory: an Introduction to Large Cardinals,

North Holland, 1974.
[3] H.B. Enderton, Elements of Set Theory, Academic Press, 1977.
[4] T. Jech, Set Theory, Springer Verlag (segunda edição), 2002.
[5] P. Suppes, Axiomatic Set Theory, Dover, 1972.
81

Teoria Axiomática Dos Conjuntos

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Teoria Axiomática Dos Conjuntos

Uploaded by

Copyright:

Available Formats

Teoria Axiomática de Conjuntos:

1 Teoria Cumulativa de Tipos 4

2 Axiomas Básicos da Teoria de Conjuntos 5

11 Axiomas Finais de ZF . O Axioma da Escolha 46

13 Indução e Recursão Transfinita 54

1 Teoria Cumulativa de Tipos

Nı́vel 0: alguns indivı́duos (urelemente), sem propriedades especı́ficas.

Assim, se os indivı́duos são os números naturais, então 3 é um conjunto no

Nı́vel 0: alguns indivı́duos.

2 Axiomas Básicos da Teoria de Conjuntos

é a coleção de todos os conjuntos, chamada de classe universal. V é uma

Aqui é evidenciada a intenção de que, quando uma coleção aparecer em dife-

Axioma de Compreensão ou Separação:

[A2] (∃y)(∀x)(x ∈ y ↔ (x ∈ a ∧ ϕ(x)))

Isto significa que estamos “separando” alguns elementos de a, exatamente aque-

s = t denota (∃z)((∀x)(x ∈ z ↔ ϕ) ∧ z = t);

onde z não ocorre em ϕ nem em t.

(∃z)((∀x)(x ∈ z ↔ ϕ) ∧ (∃u)((∀x)(x ∈ u ↔ φ) ∧ z ∈ u)).

Se (∃y)(∀x)(x ∈ y ↔ ϕ(x)) é demonstrado a partir dos axiomas, dizemos que

é legitimado. Note que este (meta)termo depende de a (e das variáveis diferentes

Observação 2.1 Se si ≡def {x : ϕi (x)} é legitimado (i = 1, . . . , n), então

Demonstração: Sejam α ≡def (∃y)(∀x)(x ∈ y ↔ ϕ(x)) e β ≡def (∃y)((∀z)(z ∈

Desta maneira, se s ≡def {x : ϕ(x)} e t ≡def {x : φ(x)} são legitimados,

Axioma do Conjunto Vazio:

Corolário 2.3 [A1], [A2] ` x 6∈ ∅.

Demonstração: Pela Proposição 2.2,

(note que o antecedente desta implicação expressa que ∅ ≡def {x : x 6= x} é

[PR] (∃y)(∀x)(x ∈ y ↔ ((x = a) ∨ (x = b)))

respectivamente. É claro que s ⊆ t ↔ (∀x)(ϕ(x) → φ(x)) se s ≡def {x : ϕ(x)}

Axioma da Reunião Finita:

[RF] (∃y)(∀x)(x ∈ y ↔ (x ∈ a ∨ x ∈ b))

Aqui estabelecemos que a ∪ b ≡def {x : (x ∈ a) ∨ (x ∈ b)} é legitimado. Este

Por [A2], a − b ≡def {x : (x ∈ a) ∧ (x 6∈ b)} é legitimado.

Exercı́cios 2.7 Provar na TC obtida até agora o seguinte:

Observação 2.8 A partir das expressões obtidas na Proposição 2.2 e no E-

si ≡def {x : φi (x)} (i = 1, . . . , n) e {x : ϕ(x, x1 , . . . , xn , z1 , . . . , zk )}

são legitimados então, usando a Proposição 2.2, {x : ϕ(x, z1 , . . . , zk )} é legi-

Axioma das Partes:

[A3] (∃y)(∀x)(x ∈ y ↔ (∀z)(z ∈ x → z ∈ a))

Este axioma garante en ZF que o conjunto {x : x ⊆ a} pode ser formado,

Proposição 3.1 (1) a ∈ P(a); ∅ ∈ P(a) na TC introduzida até agora.

∅ ∈ P(a) ∼ (∃w)((∀x)(x ∈ w ↔ x 6= x) ∧ (∀x)(x ∈ w → x ∈ a)).

Logo, ∅ ∈ P(a) ∼ (∃w)((∀x)(x 6∈ w) ∧ (∀x)(x ∈ w → x ∈ a). Mas (∀x)(x 6∈ w)

P(P(∅)) = {x : (∀y)(y ∈ x → (∀z)(z 6∈ y))}

{∅, {∅}} = {x : x = ∅ ∨ x = {∅}}

portanto ϕ(x) implica φ(x), pelo Princı́pio do Terceiro Excluı́do. Analogamente

[A4] (∃y)(∀x)(x ∈ y ↔ (∃z)((x ∈ z) ∧ (z ∈ a))

Este axioma legitima em ZF o meta-termo

Demonstração: (1) Por definição,

Provaremos algumas propriedades básicas da interseção e a reunião arbitrária

Finalmente formularemos o axioma da regularidade. Este axioma, devido a Zer-

[A5] (∃y)(y ∈ x) → (∃y)(y ∈ x ∧ (∀z)¬(z ∈ x ∧ z ∈ y))

Este é o único axioma expressando a idéia que os conjuntos ocorrem en nı́veis

Definição 3.5 S é o sistema axiomático da TC que consiste dos axiomas [A1]-

Proposição 3.6 (1) S ` a 6∈ a.

Demonstração: (1) a ∈ a implica a ∈ {a} ∩ a. Por [A5] existe x ∈ {a} tal

Definição 4.1 (Kuratowski) (i) ha, bi ≡def {{a}, {a, b}}.

Proposição 4.2 S ` ha, bi = hc, di ↔ (a = c) ∧ (b = d).

Demonstração: x ∈ ha, bi sse x = {a} ou x = {a, b}, e x ∈ hc, di sse x = {c}

Definição 4.3 O produto cartesiano de a e b é dado por a × b ≡def {hx, yi :

Provaremos agora que o termo a × b é legitimado.

Proposição 4.4 a × b = {x : x ∈ P(P(a ∪ b)) ∧ (∃y)(∃z)(x = hy, zi ∧ (y ∈

Demonstração: Temos que {x : x ∈ P(P(a ∪ b)) ∧ (∃y)(∃z)(x = hy, zi ∧ (y ∈