Maybaygiare.org

Blog Network

Uma Suave Introdução à Visão por Computador

Tweet Share

Atualizada por Último sobre 5 de julho, 2019

de Visão de Computador, muitas vezes abreviado para CV, é definido como um campo de estudo que busca desenvolver técnicas que ajudam os computadores a se “ver” e entender o conteúdo das imagens digitais, tais como fotografias e vídeos.

O problema da visão computacional parece simples porque é trivialmente resolvido por pessoas, mesmo crianças muito pequenas. No entanto, em grande parte continua a ser um problema não resolvido baseado tanto na compreensão limitada da visão biológica e por causa da complexidade da percepção da visão em um mundo físico dinâmico e quase infinitamente variável.

neste post, você vai descobrir uma introdução suave para o campo de visão do computador.

Depois de ler este post, você saberá:

  • o objetivo do campo de visão computacional e sua distinção do processamento de imagem.o que torna o problema da visão computacional desafiador.problemas ou tarefas típicos da visão computacional.

kick-start o seu projecto com o meu novo livro Deep Learning for Computer Vision, incluindo tutoriais passo-a-passo e os ficheiros de código-fonte Python para todos os exemplos.vamos começar.

a Gentle Introduction to Computer Vision

a Gentle Introduction to Computer Vision
Photo by Axel Kristinsson, some rights reserved.

visão geral

Este tutorial é dividido em quatro partes; eles são:desejo que os computadores vejam o que é a visão dos computadores. desafio da visão dos computadores. tarefas da visão dos computadores. desejo que os computadores vejam.os Smartphones têm câmeras, e tirar fotos ou vídeos e compartilhá-los nunca foi tão fácil, resultando no incrível crescimento de redes sociais modernas como o Instagram.

YouTube pode ser o segundo maior motor de busca e centenas de horas de vídeo são carregados a cada minuto e bilhões de vídeos são assistidos todos os dias.

a internet é composta por texto e imagens. É relativamente simples indexar e pesquisar texto, mas para indexar e pesquisar imagens, algoritmos precisam saber o que as imagens contêm. Durante muito tempo, o conteúdo de imagens e vídeos permaneceu opaco, sendo melhor descrito usando as meta-descrições fornecidas pela pessoa que as carregou.

para tirar o máximo partido dos dados da imagem, precisamos de computadores para “ver” uma imagem e compreender o conteúdo.

Este é um problema trivial para um humano, mesmo crianças pequenas.

  • uma pessoa pode descrever o conteúdo de uma fotografia que viu uma vez.uma pessoa pode resumir um vídeo que só viu uma vez.uma pessoa pode reconhecer um rosto que só viu uma vez antes.

requeremos pelo menos as mesmas capacidades dos computadores para desbloquear as nossas imagens e vídeos.

Want Results with Deep Learning for Computer Vision?

tome o meu curso livre de estoiro de e-mail de 7 dias agora (com o código de exemplo).

Clique para se inscrever e também obter uma versão ebook PDF livre do curso.

baixe o seu Mini-curso gratuito

o que é a visão do computador?

a visão computacional é um campo de estudo focado no problema de ajudar os computadores a ver.

em um nível abstrato, o objetivo dos problemas de visão computacional é usar os dados de imagem observados para inferir algo sobre o mundo.

— Page 83, Computer Vision: Models, Learning, and inferência, 2012.

é um campo multidisciplinar que pode ser amplamente chamado de subcampo de inteligência artificial e aprendizagem de máquinas, que pode envolver o uso de métodos especializados e fazer uso de algoritmos de aprendizagem geral.

Overview of the Relationship of Artificial Intelligence and Computer Vision

Overview of the Relationship of Artificial Intelligence and Computer Vision

um problema particular na visão pode ser facilmente abordado com um método estatístico artesanal, enquanto outro pode exigir um conjunto grande e complexo de algoritmos de aprendizagem generalizada de máquinas.

a visão computacional como um campo é uma fronteira intelectual. Como qualquer fronteira, é emocionante e desorganizada, e muitas vezes não há autoridade confiável para apelar. Muitas ideias úteis não têm fundamento teórico, e algumas teorias são inúteis na prática; áreas desenvolvidas são amplamente dispersas, e muitas vezes um parece completamente inacessível do outro.

— Page xvii, Computer Vision: a Modern Approach, 2002.

O objetivo da visão computacional é compreender o conteúdo das imagens digitais. Tipicamente, isso envolve o desenvolvimento de métodos que tentam reproduzir a capacidade da visão humana.

compreender o conteúdo de imagens digitais pode envolver extrair uma descrição da imagem, que pode ser um objeto, uma descrição de texto, um modelo tridimensional, e assim por diante.

Computer vision is the automated extraction of information from images. Informações podem significar qualquer coisa a partir de modelos 3D, posição da câmera, detecção de objetos e reconhecimento para agrupar e pesquisar conteúdo de imagem.

— Page ix, Programming Computer Vision with Python, 2012.

A Visão Computacional e o processamento de imagens

a visão computacional é distinta do processamento de imagens.

processamento de imagem é o processo de criação de uma nova imagem a partir de uma imagem existente, normalmente simplificando ou melhorando o conteúdo de alguma forma. É um tipo de processamento de sinal digital e não está preocupado com a compreensão do conteúdo de uma imagem.

um dado sistema de visão computacional pode exigir que o processamento de imagem seja aplicado à entrada bruta, por exemplo, imagens pré-processadas.exemplos de processamento de imagem incluem:

  • normalizando as propriedades fotométricas da imagem, tais como brilho ou cor.Cropping the bounds of the image, such as centering an object in a photograph.removendo o ruído digital de uma imagem, como artefatos digitais de baixos níveis de luz.

desafio da Visão Computacional

ajudar os computadores a ver acaba por ser muito difícil.

o objetivo da visão computacional é extrair informações úteis das imagens. Esta foi uma tarefa surpreendentemente desafiadora; ocupou milhares de mentes inteligentes e criativas ao longo das últimas quatro décadas, e apesar disso ainda estamos longe de ser capazes de construir uma máquina de visão de propósito geral.”

— Page 16, Computer Vision: Models, Learning, and inferência, 2012.

a visão do computador parece fácil, talvez porque é tão fácil para os seres humanos.inicialmente, acreditava-se que era um problema trivialmente simples que poderia ser resolvido por um estudante conectando uma câmera a um computador. Após décadas de pesquisa ,a “visão computacional” permanece por resolver, pelo menos em termos de satisfazer as capacidades da visão humana.

fazer uma visualização por computador era algo que os principais especialistas no campo da Inteligência Artificial pensavam estar no nível de dificuldade do projeto de um estudante de verão nos anos sessenta. Quarenta anos depois, a tarefa ainda não foi resolvida e parece formidável.

— Page xi, Multiple View Geometry in Computer Vision, 2004.uma razão é que não temos uma compreensão forte de como a visão humana funciona.o estudo da visão biológica requer uma compreensão dos órgãos de percepção como os olhos, bem como a interpretação da percepção dentro do cérebro. Muito progresso tem sido feito, tanto em gráficos o processo e, em termos de descobrir os truques e atalhos utilizados pelo sistema, embora, como qualquer estudo que envolve o cérebro, existe um longo caminho a percorrer.

Perceptual psicólogos passaram décadas tentando entender como o sistema visual funciona e, mesmo que eles podem conceber a ilusões de óptica para destrinçar alguns dos seus princípios, uma completa solução para este quebra-cabeça permanece elusiva

— Página 3, de Visão de Computador: Algoritmos e Aplicações, 2010.

outra razão pela qual é um problema tão desafiador é por causa da complexidade inerente ao mundo visual.

Um dado objeto pode ser visto a partir de qualquer orientação, em quaisquer condições de iluminação, com qualquer tipo de oclusão de outros objetos, e assim por diante. Um verdadeiro sistema de visão deve ser capaz de” ver ” em qualquer um de um número infinito de cenas e ainda extrair algo significativo.

computadores funcionam bem para problemas apertados, não problemas abertos sem restrições como a percepção visual.no entanto, tem havido progressos no campo, especialmente nos últimos anos com sistemas de commodities para reconhecimento de caracteres ópticos e detecção de face em câmeras e smartphones.

a visão computacional está em um ponto extraordinário em seu desenvolvimento. O assunto em si tem sido em torno desde a década de 1960, mas só recentemente tem sido possível construir sistemas de computador úteis usando ideias da visão de computador.

— Page xviii, Computer Vision: a Modern Approach, 2002.

the 2010 textbook on computer vision titled “Computer Vision: Algorithms and Applications” provides a list of some high-level problems where we have seen success with computer vision.

  • reconhecimento Óptico de caracteres (OCR)
  • Máquina de inspeção
  • Varejo (e.g. automatizado checkouts)
  • modelo 3D do edifício (fotogrametria)
  • imagens Médicas
  • segurança Automotiva
  • Correspondência de movimento (e.g. fundindo CGI com atores ao vivo em filmes)
  • captura de movimento (mocap)
  • vigilância

  • reconhecimento de impressões digitais e biometria

é uma ampla área de estudo com muitas tarefas e técnicas especializadas, bem como especializações para os domínios de Aplicação Alvo.

a visão computacional tem uma grande variedade de aplicações, tanto antigas (por exemplo, navegação móvel de robôs, inspeção industrial e inteligência militar) quanto novas (por exemplo, navegação de robôs móveis, inspeção industrial e inteligência militar)., interação de computador humano, recuperação de imagem em bibliotecas digitais, análise de imagem médica, e a renderização realista de cenas sintéticas em computação gráfica).

— Page xvii, Computer Vision: a Modern Approach, 2002.

pode ser útil ampliar algumas das tarefas mais simples de visão de computador que você provavelmente encontrará ou estará interessado em resolver, dado o grande número de fotografias digitais e vídeos disponíveis publicamente.

muitas aplicações populares de visão de computador envolvem tentar reconhecer coisas em fotografias; por exemplo:

  • classificação de objectos: que Categoria larga de objecto está nesta fotografia?
  • identificação do objecto: que tipo de objecto está nesta fotografia?verificação do objecto: o objecto está na fotografia?detecção de objectos: onde estão os objectos da fotografia?
  • detecção de marcos de objectos: quais são os pontos-chave para o objecto na fotografia?
  • segmentação de objectos: que pixels pertencem ao objecto na imagem?reconhecimento de objectos: que objectos estão nesta fotografia e onde estão?

outros exemplos comuns estão relacionados com a recuperação de informação; por exemplo: encontrar imagens como uma imagem ou imagens que contêm um objecto.

Leitura Adicional

Esta secção fornece mais recursos sobre o tópico se você está procurando ir mais fundo.

Books

  • Computer Vision: Models, Learning, and inferência, 2012.
  • Programming Computer Vision with Python, 2012.
  • Multiple View Geometry in Computer Vision, 2004.Computer Vision: Algorithms and Applications, 2010.Computer Vision: a Modern Approach, 2002.

Articles

  • Computer vision, Wikipedia.
  • visão de máquina, Wikipédia.
  • Digital image processing, Wikipedia.

resumo

neste post, descobriu uma introdução suave ao campo de visão computacional.

especificamente, você aprendeu:

  • o objetivo do campo de visão computacional e sua distinção do processamento de imagem.o que torna o problema da visão computacional desafiador.problemas ou tarefas típicos da visão computacional.tem alguma pergunta?Faça suas perguntas nos comentários abaixo e farei o meu melhor para responder.

    desenvolver modelos de aprendizagem profunda para a visão de hoje!

    Deep Learning for Computer Vision

    desenvolver os seus próprios modelos de visão em minutos

    …with just a few lines of python code

    Discover how in my new Ebook:
    Deep Learning for Computer Vision

    it provides self-study tutorials on topics like:
    classification, object detection (yolo and rcnn), face recognition (vggface and facenet), data preparation and much more…

    finalmente trazer a aprendizagem profunda para os seus projetos de visão

    saltar os acadêmicos. Apenas Resultados.

    ver o que está dentro

    Tweet Share

Deixe uma resposta

O seu endereço de email não será publicado.